Новый спайдер на основе htmlparser + soupselect
На досуге набросал новый спайдер для очередного микропроекта. В этот раз я решил не использовать jsdom (как в нескольких предыдущих), а остановиться на связке htmlparser + soupselect. Страница сначала отдаётся парсеру, а поиск по полученному DOM делается с помощью SoupSelect.
Архитектура спайдера
Архитектура самого спайдера тоже отличается от предыдущего. На этот раз в основе лежит EventEmitter, а [...]
|
Отправить комментарий
Приветствуются комментарии:Для остальных вопросов и обсуждений есть форум.