Показать сообщение отдельно
  #1 (permalink)  
Старый 03.11.2012, 16:58
Интересующийся
Отправить личное сообщение для psixojoker Посмотреть профиль Найти все сообщения от psixojoker
 
Регистрация: 23.03.2012
Сообщений: 12

Парсить иcходник страницы после всех манипуляций JS с DOM
В таблицу с помощью js(Ajax) при загрузке страницы сразу подгружаются данные(их и нужно спарсить). Если просмотреть исходный код страницы, то данных там нет. Понятно, что они подгружаются динамически и уже на клиентской стороне.
Вопрос, как парсить?

Я нашел статью, где описывается как написать плагин к хрому на jQuery, который вроде бы может сначала получить исходник, потом выполнить все js скрипты и дать возможность рыться в сформированном документе. Сделал все как там написано - не работает. Данных нет.
К Selenium боюсь прикасаться, потому что чувствую, не разберусь в нем.

Пытался разобраться откуда именно подгружаются данные, нашел обфусцированный js на 26 тыс. строк кода, который очевидно этим и занимается, однако там черт ногу сломит - я не смог разобраться.

Подскажите пожалуйста, как мне лучше(проще) поступить?
Ответить с цитированием