subzey,
У меня не паранойя, а шизофрения. зы: паранойя у меня по поводу за всеми следят кто надо. :) |
Gozar,
ах этот Гугл, который знает, что мы ищем, какие сайты посещаем, где мы находимся, нашу переписку, наши фотографии, наши документы, да еще и обозревает нас со спутника! |
парсинг-грабинг тема конечно интересная, но совсем новая для меня.
Стыдно, но до курла руки пока не дошли( особо не надо было никогда). Только file_get_contents. Неужели так легко слизать сайт? Ну я понимаю те сайты которые свой контент для поисковиков предоставляют. А если это не главное, то на ajax-е можно же замутить защиту похитрее? Ну получил курл кучу хтмл и кода, да только не всего, что он его запускать станет? |
micscr, это уже забота составителя граббера. Парсер сам по себе не догадается, что нужно еще один (несколько) запросов (возможно, маскируясь под XHR) отправить для получения "полной картины".
А курл в основном используется, если не ошибаюсь, когда нужны сессии (имитируем залогиненного юзера) или специфические методы (POST, загрузка файлов, etc). |
Цитата:
Цитата:
хотя есть пара глюков в нем, например с куками. хотя есть сферы, где и им нужных средств не достигнешь, и приходится уже писать на голых сокетах |
Года три назад я через курл шарился из одной канторы по сайтам вроде bash-орга, там на тему "какие сайты смотришь" был пунктик, могли даже рукавицами ежевыми по зарплате погладить если что не понравиться. Технология у него действительно проста как танк т34.
|
И вообще я тогда php больше уважал, чем сейчас.
|
Цитата:
|
Цитата:
|
Цитата:
или вы думаете, что я брал лопату, одевал валенки и шел во двор курл разгребать? ;) насколько мне известно курл в браузере не работает. |
Часовой пояс GMT +3, время: 17:36. |