Javascript.RU

Создать новую тему Ответ
 
Опции темы Искать в теме
  #81 (permalink)  
Старый 13.03.2010, 08:28
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Именно из-за сложностей возникших у Gvozd, я отказался от написания подобного рода парсеров на php. php серверная технология и использовать её нужно на сервере, ИМХО.

Как насчет контроля происходящего в данный момент?

Я очень сомневаюсь что подобный парсер поддается контролю и возможности гибкой донастройки прямо во время работы.
Ответить с цитированием
  #82 (permalink)  
Старый 13.03.2010, 08:43
Аватар для micscr
Профессор
Отправить личное сообщение для micscr Посмотреть профиль Найти все сообщения от micscr
 
Регистрация: 10.09.2009
Сообщений: 1,576

Сообщение от Tim Посмотреть сообщение
т.е. передавать их и боту
чем больше сделать проблем, тем дороже услуги по сграбливанию и может оказаться вообще не эфективно. Придумать можно многое.
Ответить с цитированием
  #83 (permalink)  
Старый 13.03.2010, 08:55
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Сообщение от micscr Посмотреть сообщение
чем больше сделать проблем, тем дороже услуги по сграбливанию
Верно подмечено, это наверное самый лучший способ защиты - сделать так чтобы копипастить было не выгодно.
Ответить с цитированием
  #84 (permalink)  
Старый 13.03.2010, 09:25
Аватар для Gvozd
Матрос
Отправить личное сообщение для Gvozd Посмотреть профиль Найти все сообщения от Gvozd
 
Регистрация: 04.04.2008
Сообщений: 6,246

Сообщение от Gozar
php серверная технология и использовать её нужно на сервере, ИМХО.
а)кто сказал, что если она серверная изначально делалась, то ее круг применения надо ограничивать только сервером. времена когда PHP ни на что большее не был годен, прошли
б)мои скрипты и так обычно на сервере запускаются
Сообщение от Gozar
Как насчет контроля происходящего в данный момент?
на уровне движка у меня такая ф-ция не реализована.
но для конкретного проекта я могу сделать как логирования произошедших действий, для оценки оставшегося объема работы, так и прочее
Сообщение от Gozar
Я очень сомневаюсь что подобный парсер поддается контролю и возможности гибкой донастройки прямо во время работы.
собираюсь дорабатывать движок под эту ф-циональность.
вообще же все это вполне можно красиво и удобно сделать. не понимаю ваших сомнений.
у меня это не реализовано, лишь только потому что на данный момент это больше нужно мне нежели заказчикам, и я тупо не успеваю в суете есделать этого
Ответить с цитированием
  #85 (permalink)  
Старый 13.03.2010, 09:56
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Сообщение от Gvozd Посмотреть сообщение
а)кто сказал, что если она серверная изначально делалась, то ее круг применения надо ограничивать только сервером.
Я так считаю. Чуть копни и тут же получишь грабли. Это следует даже из ваших слов, вам нужно точить парсеры сугубо индивидуально для каждого проекта. Уровень абстракции 0.

Сообщение от Gvozd Посмотреть сообщение
на уровне движка у меня такая ф-ция не реализована.
но для конкретного проекта я могу сделать как логирования произошедших действий, для оценки оставшегося объема работы, так и прочее

собираюсь дорабатывать движок под эту ф-циональность.
вообще же все это вполне можно красиво и удобно сделать. не понимаю ваших сомнений.
у меня это не реализовано, лишь только потому что на данный момент это больше нужно мне нежели заказчикам, и я тупо не успеваю в суете есделать этого
Сколько лет вы разрабатывали свой парсер? Год, два?

Исходя из всего вышесказанного мой вердикт звучит так: технология эта топорная и должна остаться в прошлом.
Ответить с цитированием
  #86 (permalink)  
Старый 13.03.2010, 10:06
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Вообще против php как языка я ничего не имею против, более того я его использую, но по прямому назначению - как серверный язык.

Возможно, я даже буду рад если все будут думать как вы. Это позволит мне без напрягов развиваться дальше.
Ответить с цитированием
  #87 (permalink)  
Старый 13.03.2010, 10:37
Аватар для micscr
Профессор
Отправить личное сообщение для micscr Посмотреть профиль Найти все сообщения от micscr
 
Регистрация: 10.09.2009
Сообщений: 1,576

Сообщение от Gozar Посмотреть сообщение
Это позволит мне без напрягов развиваться дальше.
напряги тут - лишние конкуренты?
Ответить с цитированием
  #88 (permalink)  
Старый 13.03.2010, 10:43
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

micscr,
все мы друг-другу в чем-то конкуренты
Ответить с цитированием
  #89 (permalink)  
Старый 13.03.2010, 12:00
Аватар для Gvozd
Матрос
Отправить личное сообщение для Gvozd Посмотреть профиль Найти все сообщения от Gvozd
 
Регистрация: 04.04.2008
Сообщений: 6,246

Сообщение от Gozar
вам нужно точить парсеры сугубо индивидуально для каждого проекта. Уровень абстракции 0.
хорошо
и на каком же языке, можно написать парсер универсальный и сам распознающий контент на странице?
самые лучшие десктопные приложения пока что предлагают составлять проект в wysiwg-редакторе указывая интересующие нас элементы на странице, а он сам уже дальше сграбит со всех страниц указаные элементы.
есть универсальные парсеры для конкретных движков(потому что верстка типизирована), или же который выдирает основной блок контента, находя(в первом упрощении) самый большой текстовый блок не являющийся часть повторяющегося дизайна и других неконтентых элементов.
но универсального парсера, который бы разделял страницу сам на нужные вам текстовые элементы, и давал бы это в виде красивой реляционной базы - нету.ни на каких языках.
и уровня абстракции, когда я указываю основные заголовки для страницы, если они отличаются от стандартных, и набиваю с полдесятка XPath-выражений, мне вполне достаточно.
Сообщение от Gozar
Сколько лет вы разрабатывали свой парсер? Год, два?
а я его почти и не разрабатываю на самом деле.
он у меня находится на уровне минимально необходимом для достаточно ыбстрого создания большинства проектов, и если мне что-то надо сделать дополнительное, обычно реализую не в самом движке, а уже в индивидуальной части проекта
и это не парсер, а движок для удобной разработки многопоточных парсеров.
буквально месяц назад мне пришлось его переписать с нуля по нескольким причинам, одна из которых то, что у меня не совсем хорошо была организована многопоточная скачка
Сообщение от Gozar
Исходя из всего вышесказанного мой вердикт звучит так: технология эта топорная и должна остаться в прошлом.
это исключительно ваше мнение
мои парсеры верой и правдой служат моим заказчикам, и в большинстве своем они полностью довольны моей работой
Сообщение от Gozar
Вообще против php как языка я ничего не имею против, более того я его использую, но по прямому назначению - как серверный язык.

Возможно, я даже буду рад если все будут думать как вы. Это позволит мне без напрягов развиваться дальше.
опять-таки вы вбили себе факт в голову, и свято держитесь за него.
это просто святая вера. и не думаю, что мы получим пользу от холивара на этой почве.
я считаю, что PHP можно использовать для того, для чего его можно использовать.
если он может создавать десктопные клиентские приложения с графическим(не-web) Интерфейсом, то почему-бы и нет.
написание же парсеров на PHP обусловлено тем, что большинству заказчиков предпочтительней именно этот язык разработки парсера.
так исторически сложилось
Ответить с цитированием
  #90 (permalink)  
Старый 13.03.2010, 12:12
Аватар для Gozar
Отправить личное сообщение для Gozar Посмотреть профиль Найти все сообщения от Gozar
 
Регистрация: 07.06.2007
Сообщений: 7,504

Сообщение от Gvozd Посмотреть сообщение
написание же парсеров на PHP обусловлено тем, что большинству заказчиков предпочтительней именно этот язык разработки парсера.
Для меня такое заявления звучит очень абсурдно. Какое дело заказчикам на каком языке написан парсер?
Ответить с цитированием
Ответ



Опции темы Искать в теме
Искать в теме:

Расширенный поиск