Цитата:
|
Цитата:
Я тут подумал если держать у себя картинку 200px*200px с набором различных капчей и на сервере хранить какая из них а клиенту передавать только соответствующие отступы для фона элемента заданного размера, то думаю справимся с граберами. :victory: :) |
Цитата:
|
Цитата:
|
Цитата:
|
Цитата:
|
Цитата:
Цитата:
Цитата:
работаю именно этим инструментом(если ты подразумеваешь DOM classes) и почему-то он у меня отлично работает. и не падает ничего. и верстку невалидную я ему на ура скармливаю. вернее сказать, я вообще не проверяю валидная ли верстка. если бы использовал регулярки как свой основной инструмент, я бы не занял бы ту позицию на рынке, которую занимаю. на голых регулярках далеко не уедешь. XPath-сила |
Цитата:
Цитата:
Цитата:
Цитата:
|
Хоть я и не занимаюсь парсерами профессионально, соглашусь с Gvozd'ем, регулярки для разбора html не подходят, только конечный автомат.
|
Цитата:
DOM classes связаны с разбором XML-а(и даже HTML-а) Цитата:
особенно мне не смешно было когда я в прошлом месяце загуглил универсальное решение проблемы кодировок при работе с этими классами. ранее почему-то в одном и том-же случае я получал совершенно разные результаты на выходе, которые не поддавалась декодированию ни логикой ни iconv порой. просто немного упорства нужно если нечто есть в PHP, то значит кто-то же его разрабатывал и тестировал. и кто-то же пользуется этим. именно упорство помогло мне сделать красивый класс для многопоточной закачки на CURL-е. Уникальных русскоязычных статей по теме multi-CURL штуки три. примеров кода не из документации(там они не раскрывают всех тонкостей) вообще в интернете также мало. пришлось потратить немало времени. Цитата:
высвободившееся время можно с толком потратить на что-то полезное или интересное Цитата:
а разве DOM-парсер и регулярные выражения не являются оба конечными автоматами? первый с набор всегда одинаковым набором состояний и переходов, а второй даже таблицу переходов в явном виде не составляет(полагаю) кстати к DOM-у еще прилагается XPath, также являющийся конечным автоматом. |
Часовой пояс GMT +3, время: 17:36. |