Javascript-форум (https://javascript.ru/forum/)
-   Оффтопик (https://javascript.ru/forum/offtopic/)
-   -   Принцип Javascript парсинга (https://javascript.ru/forum/offtopic/10588-princip-javascript-parsinga.html)

greatilya 11.07.2010 06:24

Принцип Javascript парсинга
 
Прощу прощения если запульнул не в тот раздел, не смог выбрать более подходящий.

Столкнулся с идеей парсинга сайта на Javascript. Имеется HTML страница с картинками. Нужно методом POST отправить:
1. код страницы
2. картинки (1-4 штуки, файлами)

С 1 пунктов проблем я думаю не возникнет. Если действовать стандартными методами, то это фрейм который подгружает нужный УРЛ, после чего мы запрашиваем у него видимо innerHTML, или что-то другое, но думаю это не сложно. А на jQuery есть функция load() для получения кода страницы, думаю она даже лучше подойдет.

Потом полученный код обрабатываю и ищу в нем адреса нужных картинок. И вот тут наверное главный вопрос, а как их прикрепить к отправке формы, как будто мы отправили через <input type="file" ... > ?

...

Как я понял отправить методом POST не получится файлы, т.к. это нарушает принцип безопасности HTML. А имеет ли жизнь такой вариант: через какую-нить Javascript функцию получить код картинки (а-ля бинарный код или т.п.) его закинуть в <textarea>. А на стороне сервера обратно скомпилировать из него картинку? (картинки в формате jpg)

Riim 11.07.2010 07:31

Наверное, лучше сразу в сторону флеша копать.

greatilya 11.07.2010 08:18

Цитата:

Сообщение от Riim
Наверное, лучше сразу в сторону флеша копать

флеш, совсем не знаю...
а на Javascript возможно получить код картинки? чтобы потом перекодировать обратно на PHP...

Riim 11.07.2010 08:29

Цитата:

Сообщение от greatilya
а на Javascript возможно получить код картинки?

99.9% нет, разве что в IE. Еще, кажется, можно цвета пикселей на canvas-е в FF получать.

B@rmaley.e><e 11.07.2010 08:30

Можно только XHR'ом, на который действует ограничение по доменам.

PeaceCoder 11.07.2010 11:01

Непонимаю зачем так ломать голову? Получаете адрес картинки и отправляете его серверу. На серверной стороне просто получаете данные get_file_contents и записываете на сервер. все. зачем еще чето мудрить?

Gozar 11.07.2010 11:11

greatilya,
картинки это каптча?

greatilya 11.07.2010 15:55

Цитата:

Сообщение от Gozar
картинки это каптча?

Нет не капча... а просто парсинг...

да я уже понял... вначале "обломался" с картинками... потом оказывается и с фреймов инфу не получить.... придется парсить с сервера на динамическом ip...
Всем спасибо!

Gozar 11.07.2010 18:17

Цитата:

Сообщение от greatilya (Сообщение 63185)
да я уже понял... вначале "обломался" с картинками... потом оказывается и с фреймов инфу не получить.... придется парсить с сервера на динамическом ip...

а при чем здесь динамический ip?

То что вы обломались не означает что вопрос не решаем, по поводу фреймов могу сказать что эту идиотскую мысль нужно откинуть сразу как только она придет. И уж тем более не понятно зачем отсылать на свой же по видимому локальный сервер, то что уже получено?

PeaceCoder 11.07.2010 18:43

Цитата:

Сообщение от Gozar
то что уже получено?

он по ходу хочет перевести адрес картинки в данные этой картинки.


Часовой пояс GMT +3, время: 15:37.