Цитата:
ведь тогда я останусь достаточно быстро без работы точнее мне придется искать другую работу. занимаюсь как раз созданием парсеров-граберов. и далеко не "каша из регекспов php + mysql для текстовой базы", хотя пишу свои парсеры на PHP Цитата:
у меня щаз лежит на винтах аккуратненькая копия википедии. только пока не нашел еще куда пристроить такое сокровище. ведь википедия в виде единого архива доступна к свободному скачиванию.формат - предназначенный для того чтобы создать свою копию википедии как сайта. сторонними способами также легко разбирается. а вообще, вы достаточно долго спали на данный момент уже всякий желающий может проделать указанные вами маницпляции. стоимость парсера-граббера на рынке составляет от 20 до 100$ для подавляющего большинства сайтов. вернее сказать, это моя вилка цен.на рынке она чуточку шире. PS ищу заказы)))) парсинг-грабинг практически любых ресурсов имеется опыт обхода различных систем защиты от ботов. |
Цитата:
Ведь будь такая кнопка, невозможно отличить человек пришел или бот, да и можно ведь чередовать, то человек, то бот, где надо человек, а где надо бот :) |
Цитата:
А если он с помощью него начнет грабить все подряд и исходники выложит в сеть? |
Цитата:
на данный момент, чтобы скрипт умел прикинутся человеком, предварительно надо поработать хорошенько человеку-специалисту например на моем недавнем заказе, хоть на доноре и не стоит зашита от запросов с одного IP, но для того чтобы сделать запрос, надо вычислить довольно хитрый хеш(вычисляемый в браузере), который мне так и не удалось реализовать средствами PHP(пробелмы с 100%-й эмуляцией charCodeAt) в любом случае это война, которая еще будет длится не один год. Цитата:
большинство моих заказчиков заказывают именно скрипт, а не готовую базу. Цитата:
я указал ценовую вилку на создание одного парсера для ОДНОГО ресурса, в ОДИН строго определенный тип БД. то есть сграбить весь интернет посредством одного скрипта у заказчика не получится во всяком случае за написание универсального парсера инета, я еще даже не брался. а если исходники скрипта, либо саму базу выложит в инет, то я не сильно пострадаю. абсолютно непонимающего человека она не сделает мне конкурентом, и он с помощью скрипта сможет грабить только конкретный ресурс, под который скрипт заточен шарящий же человек, может быть найдет кое-какие интересные нестандартные решения, которые помогут ему.вероятность что такой человек отобьет конкретно у меня заказ - ничтожна. вероятность, что у меня будет отбито более одного заказа, из-за этого факта - равна нулю |
Gvozd,
Последний вопрос меня в принципе не особо волнует. Разве что из праздного любопытства. зы:Хотелось бы еще чье-нибудь мнение услышать. |
Цитата:
|
Шутка :)
А если бы не была шуткой, достоин ли мир этого? |
защищать сайт от скачивания для копипаста - бессмысленно.
защищать права можно в определенной степени в частности оповестив поисковики о том, что твой сайт является основным, и является оригиналом информации. например такое возможно в случае яндекса, насколько я знаю. поисковики имеют инструменты для того чтобы отличить оригинал от копипаста. Тот же Платон Яндексовский. С более глубоким же приходом вебтринольных технологий копипаст исчезнет, так как в нем уже не будет того смысла. ИМХО в результате человечество получит кучу уникальных знаний по автоматической интелектуальной обработке информации. так что можно считать копипаст-вынужденной детской болезнью. Это не противостояние вирусов и антивирусов, где по сути борьба ради борьбы, без конечной глобальной перспективы(лично я ее не вижу). тут все вполне конечно, ИМХО |
Цитата:
А защита в виде вычислений в браузере я уже сказал не защита в данном случае вообще :) |
Хм, а все таки тема эта пока еще актуальна ;)
|
Часовой пояс GMT +3, время: 05:55. |