Именно из-за сложностей возникших у Gvozd, я отказался от написания подобного рода парсеров на php. php серверная технология и использовать её нужно на сервере, ИМХО.
Как насчет контроля происходящего в данный момент? Я очень сомневаюсь что подобный парсер поддается контролю и возможности гибкой донастройки прямо во время работы. |
Цитата:
|
Цитата:
|
Цитата:
б)мои скрипты и так обычно на сервере запускаются;) Цитата:
но для конкретного проекта я могу сделать как логирования произошедших действий, для оценки оставшегося объема работы, так и прочее Цитата:
вообще же все это вполне можно красиво и удобно сделать. не понимаю ваших сомнений. у меня это не реализовано, лишь только потому что на данный момент это больше нужно мне нежели заказчикам, и я тупо не успеваю в суете есделать этого |
Цитата:
Цитата:
Исходя из всего вышесказанного мой вердикт звучит так: технология эта топорная и должна остаться в прошлом. |
Вообще против php как языка я ничего не имею против, более того я его использую, но по прямому назначению - как серверный язык.
Возможно, я даже буду рад если все будут думать как вы. Это позволит мне без напрягов развиваться дальше. |
Цитата:
|
micscr,
все мы друг-другу в чем-то конкуренты ;) |
Цитата:
и на каком же языке, можно написать парсер универсальный и сам распознающий контент на странице? самые лучшие десктопные приложения пока что предлагают составлять проект в wysiwg-редакторе указывая интересующие нас элементы на странице, а он сам уже дальше сграбит со всех страниц указаные элементы. есть универсальные парсеры для конкретных движков(потому что верстка типизирована), или же который выдирает основной блок контента, находя(в первом упрощении) самый большой текстовый блок не являющийся часть повторяющегося дизайна и других неконтентых элементов. но универсального парсера, который бы разделял страницу сам на нужные вам текстовые элементы, и давал бы это в виде красивой реляционной базы - нету.ни на каких языках. и уровня абстракции, когда я указываю основные заголовки для страницы, если они отличаются от стандартных, и набиваю с полдесятка XPath-выражений, мне вполне достаточно. Цитата:
он у меня находится на уровне минимально необходимом для достаточно ыбстрого создания большинства проектов, и если мне что-то надо сделать дополнительное, обычно реализую не в самом движке, а уже в индивидуальной части проекта и это не парсер, а движок для удобной разработки многопоточных парсеров. буквально месяц назад мне пришлось его переписать с нуля по нескольким причинам, одна из которых то, что у меня не совсем хорошо была организована многопоточная скачка Цитата:
мои парсеры верой и правдой служат моим заказчикам, и в большинстве своем они полностью довольны моей работой Цитата:
это просто святая вера. и не думаю, что мы получим пользу от холивара на этой почве. я считаю, что PHP можно использовать для того, для чего его можно использовать. если он может создавать десктопные клиентские приложения с графическим(не-web) Интерфейсом, то почему-бы и нет. написание же парсеров на PHP обусловлено тем, что большинству заказчиков предпочтительней именно этот язык разработки парсера. так исторически сложилось |
Цитата:
|
Цитата:
заказчики хотят: 1)запускать парсер в удобных для себя условиях. чаще всего на сервере. под этот запрос подходит PHP,Perl 2)возможность править парсер, при необходимости. учитывая гигантское засилье PHP-шников, в случае отсутсвие автора скрипта всегда найдется ему замена. какая разница из свинины, конины, или вообще из сои сделана колбаса? на сим я удаляюсь из этой дискусии надоело рассказывать про состояние рынка, и убеждать вас почему его те или иные особенности так или иначе обусловленны |
Цитата:
Я имел в виду, что вряд ли удастся малой кровью создать такой набор регулярок, который заменял бы специально предназначенный для разбора HTML разборщик. |
Цитата:
|
Часовой пояс GMT +3, время: 03:03. |