Javascript-форум (https://javascript.ru/forum/)
-   Общие вопросы Javascript (https://javascript.ru/forum/misc/)
-   -   Скачать и распарсить страницу (https://javascript.ru/forum/misc/3917-skachat-i-rasparsit-stranicu.html)

unkis 05.06.2009 19:18

Скачать и распарсить страницу
 
Скачать и распарсить страницу

Возможно ли на javascript реализовать следующее:

скачать страницу с определённого url к примкру www.google com.
Распарсить её и вытащить из неё нужную информацию(текст)
Есть ли готовые библиотеки, или в какую сторону смотреть.
Списибо

Gvozd 05.06.2009 19:39

нет
такое нельзя сделать на JS
из соображений безопасности браузеров,эта функция отключена
используйте серверные решения

Serg_pnz 10.06.2009 11:01

Посмотреть источник неоткрытой страницы
(Для просмотра источника страницы не открывая ее в браузере)

Содержимое этой таблицы поместите между <HEAD> и </HEAD>
<SCRIPT LANGUAGE="JavaScript">
<!-- Original: Alfie Pugh (alfiep@lineone.net) -->
<!-- Begin
function viewSource() {
document.getSource.view.value= "Пожалуйста, подождите!";
setTimeout ("document.getSource.view.value= 'Посмотреть источник!'",6000);
window.location.href= "view-source:" + document.getSource.url.value;
return false;
}
// End -->
</script>


Содержимое этой таблицы поместите между <BODY> и </BODY>
<center>
Type in a full URL and click "View Source"
<br>
<br>
<form name=getSource onSubmit="return viewSource();">
<input type=text name=url value="http://">
<br>
<br>
<input type=submit name=view value="Посмотреть источник">
</form>
</center>


Парсить - это уж сам.

B~Vladi 10.06.2009 11:06

где-то у меня лежит скриптик один... там в 3 "окна" грузяцца 3 разных домена(в том числе и гугл). Не факт, конечно, что работает везде, но всё же работает(непомню точно где). Если интересует такой вариант для тестов там - найду, скину.

Serg_pnz 10.06.2009 11:12

Можно и на аякс замутить... Смотря какие задачи...
Писал в своё время скрипт, который грабил страницу каждые 15 секунд, парсил и выдавал отчет (слежение за персонажем в он-лайн игрушке).

Kolyaj 10.06.2009 11:21

B~Vladi,
загрузить-то в ифрейм можно, но доступа к этому ифрейму не будет.

B~Vladi 10.06.2009 11:56

ок, сам никогда этим не заморачивался, если чесно. А то что доступа к фрейму нет плохо... раньше думал по-другому.

Gvozd 10.06.2009 12:21

Serg_pnz,
ну, замечательно
мы видим-то исходный текст страницы.хоть и не во всех браузерах
теперь заставьте JS увидеть этот исходный текст
сделайте на основе ваших заготовок, чтобы выкидвался alert() с содержимым страницы
и у вас ничего не получится, потмоу что JS не может получить доступ к другому домену

Serg_pnz 10.06.2009 12:47

Gvozd, уговорили.))
Тогда только на пхп грабить.


Часовой пояс GMT +3, время: 04:25.