Показать сообщение отдельно
  #2 (permalink)  
Старый 19.07.2015, 19:42
Профессор
Отправить личное сообщение для l-liava-l Посмотреть профиль Найти все сообщения от l-liava-l
 
Регистрация: 14.03.2012
Сообщений: 1,808

Цитата:
Как парсить веб страницы, что бы сильно не привязыватся к разметки страницы ?
Часто советуют юзать что то типо такого https://github.com/cheeriojs/cheerio что ты просто потом выбирать элементы и доставать из них содержимое, но если поменяют разметку, то придется переделывать, какие есть алгоритмы, парсинга страниц что бы не быть привязаным к разметки?
Я понимаю что это будет не просто решение)
Ну тебе полюбому нужно знать какой-то ключ по которому можно вытащить нужный тебе контент.
А т.к ты не владелец сайта то ключ могут поменять в любой момент. Так что либо верить в то что верстка не поменяется либо API у них попроси
__________________
Научу себя плохому
Ответить с цитированием