Javascript-форум (https://javascript.ru/forum/)
-   Оффтопик (https://javascript.ru/forum/offtopic/)
-   -   Ящик Пандоры или тотальный копипаст (https://javascript.ru/forum/offtopic/8129-yashhik-pandory-ili-totalnyjj-kopipast.html)

Gvozd 09.03.2010 19:44

Цитата:

Сообщение от Gozar
эдакая кнопка в браузере "Сохранить весь сайт в нужной форме на компьютер в виде базы" и браузер этот был бы у всех.

не страшно, от такой перспективы?

меня такая перспектива очень пугает
ведь тогда я останусь достаточно быстро без работы
точнее мне придется искать другую работу.
занимаюсь как раз созданием парсеров-граберов.
и далеко не "каша из регекспов php + mysql для текстовой базы", хотя пишу свои парсеры на PHP
Цитата:

Сообщение от Gozar
А что бы Вы сделали будь у Вас возможность с легкостью "сливать" к примеру википедию?

я это именно это и сделал.
у меня щаз лежит на винтах аккуратненькая копия википедии.
только пока не нашел еще куда пристроить такое сокровище.
ведь википедия в виде единого архива доступна к свободному скачиванию.формат - предназначенный для того чтобы создать свою копию википедии как сайта.
сторонними способами также легко разбирается.

а вообще, вы достаточно долго спали
на данный момент уже всякий желающий может проделать указанные вами маницпляции.
стоимость парсера-граббера на рынке составляет от 20 до 100$ для подавляющего большинства сайтов.
вернее сказать, это моя вилка цен.на рынке она чуточку шире.

PS ищу заказы))))
парсинг-грабинг практически любых ресурсов
имеется опыт обхода различных систем защиты от ботов.

Gozar 09.03.2010 19:56

Цитата:

Сообщение от Gvozd (Сообщение 47249)
имеется опыт обхода различных систем защиты от ботов.

В Вашем случае нужен обхода различных систем от ботов, а я говорю о том, что защиты и вовсе нет.

Ведь будь такая кнопка, невозможно отличить человек пришел или бот, да и можно ведь чередовать, то человек, то бот, где надо человек, а где надо бот :)

Gozar 09.03.2010 19:58

Цитата:

Сообщение от Gvozd (Сообщение 47249)
стоимость парсера-граббера на рынке составляет от 20 до 100$ для подавляющего большинства сайтов.

И парсер остается у заказчика?

А если он с помощью него начнет грабить все подряд и исходники выложит в сеть?

Gvozd 09.03.2010 20:20

Цитата:

Сообщение от Gozar
Ведь будь такая кнопка, невозможно отличить человек пришел или бот, да и можно ведь чередовать, то человек, то бот, где надо человек, а где надо бот

не все так просто
на данный момент, чтобы скрипт умел прикинутся человеком, предварительно надо поработать хорошенько человеку-специалисту
например на моем недавнем заказе, хоть на доноре и не стоит зашита от запросов с одного IP, но для того чтобы сделать запрос, надо вычислить довольно хитрый хеш(вычисляемый в браузере), который мне так и не удалось реализовать средствами PHP(пробелмы с 100%-й эмуляцией charCodeAt)
в любом случае это война, которая еще будет длится не один год.
Цитата:

Сообщение от Gozar
И парсер остается у заказчика?

да
большинство моих заказчиков заказывают именно скрипт, а не готовую базу.
Цитата:

Сообщение от Gozar
А если он с помощью него начнет грабить все подряд и исходники выложит в сеть?

наверно вы не совсем меня поняли
я указал ценовую вилку на создание одного парсера для ОДНОГО ресурса, в ОДИН строго определенный тип БД.
то есть сграбить весь интернет посредством одного скрипта у заказчика не получится
во всяком случае за написание универсального парсера инета, я еще даже не брался.
а если исходники скрипта, либо саму базу выложит в инет, то я не сильно пострадаю.
абсолютно непонимающего человека она не сделает мне конкурентом, и он с помощью скрипта сможет грабить только конкретный ресурс, под который скрипт заточен
шарящий же человек, может быть найдет кое-какие интересные нестандартные решения, которые помогут ему.вероятность что такой человек отобьет конкретно у меня заказ - ничтожна.
вероятность, что у меня будет отбито более одного заказа, из-за этого факта - равна нулю

Gozar 09.03.2010 20:21

Gvozd,
Последний вопрос меня в принципе не особо волнует. Разве что из праздного любопытства.

зы:Хотелось бы еще чье-нибудь мнение услышать.

Gozar 09.03.2010 20:24

Цитата:

Сообщение от Gvozd (Сообщение 47254)
в любом случае это война, которая еще будет длится не один год.

А хотите я её прямо сейчас закончу?

Gozar 09.03.2010 20:26

Шутка :)

А если бы не была шуткой, достоин ли мир этого?

Gvozd 09.03.2010 20:41

защищать сайт от скачивания для копипаста - бессмысленно.
защищать права можно в определенной степени
в частности оповестив поисковики о том, что твой сайт является основным, и является оригиналом информации.
например такое возможно в случае яндекса, насколько я знаю.
поисковики имеют инструменты для того чтобы отличить оригинал от копипаста. Тот же Платон Яндексовский.
С более глубоким же приходом вебтринольных технологий копипаст исчезнет, так как в нем уже не будет того смысла.
ИМХО

в результате человечество получит кучу уникальных знаний по автоматической интелектуальной обработке информации.
так что можно считать копипаст-вынужденной детской болезнью.
Это не противостояние вирусов и антивирусов, где по сути борьба ради борьбы, без конечной глобальной перспективы(лично я ее не вижу).
тут все вполне конечно, ИМХО

Gozar 09.03.2010 20:43

Цитата:

Сообщение от Gvozd (Сообщение 47254)
не все так просто
на данный момент, чтобы скрипт умел прикинутся человеком

Я кстати не говорил о том что скрипту нужно прикидываться человеком, я имел в виду то что имел: бот идет --- защита --- бот стоп сигнал --- человек --- защита пройдена --- бот. (один из вариантов)

А защита в виде вычислений в браузере я уже сказал не защита в данном случае вообще :)

Gozar 09.03.2010 20:53

Хм, а все таки тема эта пока еще актуальна ;)


Часовой пояс GMT +3, время: 05:55.