Javascript.RU

Создать новую тему Ответ
 
Опции темы Искать в теме
  #11 (permalink)  
Старый 09.03.2010, 19:44
Аватар для Gvozd
Матрос
Отправить личное сообщение для Gvozd Посмотреть профиль Найти все сообщения от Gvozd
 
Регистрация: 04.04.2008
Сообщений: 6,246

Сообщение от Gozar
эдакая кнопка в браузере "Сохранить весь сайт в нужной форме на компьютер в виде базы" и браузер этот был бы у всех.

не страшно, от такой перспективы?
меня такая перспектива очень пугает
ведь тогда я останусь достаточно быстро без работы
точнее мне придется искать другую работу.
занимаюсь как раз созданием парсеров-граберов.
и далеко не "каша из регекспов php + mysql для текстовой базы", хотя пишу свои парсеры на PHP
Сообщение от Gozar
А что бы Вы сделали будь у Вас возможность с легкостью "сливать" к примеру википедию?
я это именно это и сделал.
у меня щаз лежит на винтах аккуратненькая копия википедии.
только пока не нашел еще куда пристроить такое сокровище.
ведь википедия в виде единого архива доступна к свободному скачиванию.формат - предназначенный для того чтобы создать свою копию википедии как сайта.
сторонними способами также легко разбирается.

а вообще, вы достаточно долго спали
на данный момент уже всякий желающий может проделать указанные вами маницпляции.
стоимость парсера-граббера на рынке составляет от 20 до 100$ для подавляющего большинства сайтов.
вернее сказать, это моя вилка цен.на рынке она чуточку шире.

PS ищу заказы))))
парсинг-грабинг практически любых ресурсов
имеется опыт обхода различных систем защиты от ботов.
Ответить с цитированием
  #12 (permalink)  
Старый 09.03.2010, 19:56
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Сообщение от Gvozd Посмотреть сообщение
имеется опыт обхода различных систем защиты от ботов.
В Вашем случае нужен обхода различных систем от ботов, а я говорю о том, что защиты и вовсе нет.

Ведь будь такая кнопка, невозможно отличить человек пришел или бот, да и можно ведь чередовать, то человек, то бот, где надо человек, а где надо бот
Ответить с цитированием
  #13 (permalink)  
Старый 09.03.2010, 19:58
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Сообщение от Gvozd Посмотреть сообщение
стоимость парсера-граббера на рынке составляет от 20 до 100$ для подавляющего большинства сайтов.
И парсер остается у заказчика?

А если он с помощью него начнет грабить все подряд и исходники выложит в сеть?
Ответить с цитированием
  #14 (permalink)  
Старый 09.03.2010, 20:20
Аватар для Gvozd
Матрос
Отправить личное сообщение для Gvozd Посмотреть профиль Найти все сообщения от Gvozd
 
Регистрация: 04.04.2008
Сообщений: 6,246

Сообщение от Gozar
Ведь будь такая кнопка, невозможно отличить человек пришел или бот, да и можно ведь чередовать, то человек, то бот, где надо человек, а где надо бот
не все так просто
на данный момент, чтобы скрипт умел прикинутся человеком, предварительно надо поработать хорошенько человеку-специалисту
например на моем недавнем заказе, хоть на доноре и не стоит зашита от запросов с одного IP, но для того чтобы сделать запрос, надо вычислить довольно хитрый хеш(вычисляемый в браузере), который мне так и не удалось реализовать средствами PHP(пробелмы с 100%-й эмуляцией charCodeAt)
в любом случае это война, которая еще будет длится не один год.
Сообщение от Gozar
И парсер остается у заказчика?
да
большинство моих заказчиков заказывают именно скрипт, а не готовую базу.
Сообщение от Gozar
А если он с помощью него начнет грабить все подряд и исходники выложит в сеть?
наверно вы не совсем меня поняли
я указал ценовую вилку на создание одного парсера для ОДНОГО ресурса, в ОДИН строго определенный тип БД.
то есть сграбить весь интернет посредством одного скрипта у заказчика не получится
во всяком случае за написание универсального парсера инета, я еще даже не брался.
а если исходники скрипта, либо саму базу выложит в инет, то я не сильно пострадаю.
абсолютно непонимающего человека она не сделает мне конкурентом, и он с помощью скрипта сможет грабить только конкретный ресурс, под который скрипт заточен
шарящий же человек, может быть найдет кое-какие интересные нестандартные решения, которые помогут ему.вероятность что такой человек отобьет конкретно у меня заказ - ничтожна.
вероятность, что у меня будет отбито более одного заказа, из-за этого факта - равна нулю
Ответить с цитированием
  #15 (permalink)  
Старый 09.03.2010, 20:21
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Gvozd,
Последний вопрос меня в принципе не особо волнует. Разве что из праздного любопытства.

зы:Хотелось бы еще чье-нибудь мнение услышать.
Ответить с цитированием
  #16 (permalink)  
Старый 09.03.2010, 20:24
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Сообщение от Gvozd Посмотреть сообщение
в любом случае это война, которая еще будет длится не один год.
А хотите я её прямо сейчас закончу?
Ответить с цитированием
  #17 (permalink)  
Старый 09.03.2010, 20:26
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Шутка

А если бы не была шуткой, достоин ли мир этого?
Ответить с цитированием
  #18 (permalink)  
Старый 09.03.2010, 20:41
Аватар для Gvozd
Матрос
Отправить личное сообщение для Gvozd Посмотреть профиль Найти все сообщения от Gvozd
 
Регистрация: 04.04.2008
Сообщений: 6,246

защищать сайт от скачивания для копипаста - бессмысленно.
защищать права можно в определенной степени
в частности оповестив поисковики о том, что твой сайт является основным, и является оригиналом информации.
например такое возможно в случае яндекса, насколько я знаю.
поисковики имеют инструменты для того чтобы отличить оригинал от копипаста. Тот же Платон Яндексовский.
С более глубоким же приходом вебтринольных технологий копипаст исчезнет, так как в нем уже не будет того смысла.
ИМХО

в результате человечество получит кучу уникальных знаний по автоматической интелектуальной обработке информации.
так что можно считать копипаст-вынужденной детской болезнью.
Это не противостояние вирусов и антивирусов, где по сути борьба ради борьбы, без конечной глобальной перспективы(лично я ее не вижу).
тут все вполне конечно, ИМХО
Ответить с цитированием
  #19 (permalink)  
Старый 09.03.2010, 20:43
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Сообщение от Gvozd Посмотреть сообщение
не все так просто
на данный момент, чтобы скрипт умел прикинутся человеком
Я кстати не говорил о том что скрипту нужно прикидываться человеком, я имел в виду то что имел: бот идет --- защита --- бот стоп сигнал --- человек --- защита пройдена --- бот. (один из вариантов)

А защита в виде вычислений в браузере я уже сказал не защита в данном случае вообще
Ответить с цитированием
  #20 (permalink)  
Старый 09.03.2010, 20:53
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Хм, а все таки тема эта пока еще актуальна
Ответить с цитированием
Ответ



Опции темы Искать в теме
Искать в теме:

Расширенный поиск