Показать сообщение отдельно
  #1 (permalink)  
Старый 19.07.2015, 19:20
Аватар для cyber
I am Student
Отправить личное сообщение для cyber Посмотреть профиль Найти все сообщения от cyber
 
Регистрация: 17.12.2011
Сообщений: 4,415

как правильно прасить веб страницы nodejs
Как парсить веб страницы, что бы сильно не привязыватся к разметки страницы ?
Часто советуют юзать что то типо такого https://github.com/cheeriojs/cheerio что ты просто потом выбирать элементы и доставать из них содержимое, но если поменяют разметку, то придется переделывать, какие есть алгоритмы, парсинга страниц что бы не быть привязаным к разметки?
Я понимаю что это будет не просто решение)
__________________
Цитата:
Если ограничения и условия описываются как "коробка", то хитрость в том что бы найти именно коробку... Не думайте о чем то глобальном - найдите коробку.
Ответить с цитированием