Скачать и распарсить страницу
Скачать и распарсить страницу
Возможно ли на javascript реализовать следующее: скачать страницу с определённого url к примкру www.google com. Распарсить её и вытащить из неё нужную информацию(текст) Есть ли готовые библиотеки, или в какую сторону смотреть. Списибо |
нет
такое нельзя сделать на JS из соображений безопасности браузеров,эта функция отключена используйте серверные решения |
Посмотреть источник неоткрытой страницы
(Для просмотра источника страницы не открывая ее в браузере) Содержимое этой таблицы поместите между <HEAD> и </HEAD> <SCRIPT LANGUAGE="JavaScript"> <!-- Original: Alfie Pugh (alfiep@lineone.net) --> <!-- Begin function viewSource() { document.getSource.view.value= "Пожалуйста, подождите!"; setTimeout ("document.getSource.view.value= 'Посмотреть источник!'",6000); window.location.href= "view-source:" + document.getSource.url.value; return false; } // End --> </script> Содержимое этой таблицы поместите между <BODY> и </BODY> <center> Type in a full URL and click "View Source" <br> <br> <form name=getSource onSubmit="return viewSource();"> <input type=text name=url value="http://"> <br> <br> <input type=submit name=view value="Посмотреть источник"> </form> </center> Парсить - это уж сам. |
где-то у меня лежит скриптик один... там в 3 "окна" грузяцца 3 разных домена(в том числе и гугл). Не факт, конечно, что работает везде, но всё же работает(непомню точно где). Если интересует такой вариант для тестов там - найду, скину.
|
Можно и на аякс замутить... Смотря какие задачи...
Писал в своё время скрипт, который грабил страницу каждые 15 секунд, парсил и выдавал отчет (слежение за персонажем в он-лайн игрушке). |
B~Vladi,
загрузить-то в ифрейм можно, но доступа к этому ифрейму не будет. |
ок, сам никогда этим не заморачивался, если чесно. А то что доступа к фрейму нет плохо... раньше думал по-другому.
|
Serg_pnz,
ну, замечательно мы видим-то исходный текст страницы.хоть и не во всех браузерах теперь заставьте JS увидеть этот исходный текст сделайте на основе ваших заготовок, чтобы выкидвался alert() с содержимым страницы и у вас ничего не получится, потмоу что JS не может получить доступ к другому домену |
Gvozd, уговорили.))
Тогда только на пхп грабить. |
Часовой пояс GMT +3, время: 11:05. |