05.08.2011, 18:44
|
|
Модератор Всея Форума
|
|
Регистрация: 14.05.2009
Сообщений: 4,021
|
|
Сообщение от monolithed
|
Во-первых, нормальный парсер в случае ошибки, закрывает тег, на котором споткнулся и дописывает завершающие элементы
|
Ок, получается, что этот код такой парсер обработает неправильно:
<i>text<b>text</i>text</b>
хотя по стандартам всё в порядке
__________________
Болтовня ничего не стоит. Покажите мне код. — Linus Torvalds
влад.куркин.рф
|
|
05.08.2011, 19:39
|
Особый гость
|
|
Регистрация: 02.04.2010
Сообщений: 4,260
|
|
Сообщение от B~Vladi
|
Ок, получается, что этот код такой парсер обработает неправильно:
<i>text<b>text</i>text</b>
|
отработает, но только в том случае, если между дескрипторами inline-элементов будет присутствовать хотя бы один символ в т.ч. пробел.
|
|
05.08.2011, 20:19
|
|
⊞ Развернуть
|
|
Регистрация: 11.01.2010
Сообщений: 1,810
|
|
Сообщение от B~Vladi
|
И? К чему это?
|
К тому, что хедер и футер различаются семантически.
|
|
05.08.2011, 21:39
|
Новичок на форуме
|
|
Регистрация: 19.02.2008
Сообщений: 9,177
|
|
Сообщение от B~Vladi
|
Ок, получается, что этот код такой парсер обработает неправильно:
<i>text<b>text</i>text</b>
хотя по стандартам всё в порядке
|
Ты с этим примером постоянно передёргиваешь. Нет в стандарте разрешения так писать. Просто теперь в стандарте явно прописано, как должен вести себя парсер в подобной ситуации. Раньше каждый вёл себя, как умел.
|
|
05.08.2011, 21:57
|
Особый гость
|
|
Регистрация: 02.04.2010
Сообщений: 4,260
|
|
Опять я невнимательно прочитал, так не распарсится.
Действительно, кто так будет писать?
|
|
05.08.2011, 22:52
|
х.з
|
|
Регистрация: 21.11.2010
Сообщений: 4,588
|
|
Сообщение от monolithed
|
Опять я невнимательно прочитал, так не распарсится.
Действительно, кто так будет писать?
|
не поверишь,недавно делал парсер одного крупного информационного сайта из буржунета, от количества перекрещивающихся тегов ошалел..........причём, насколько понял ,они эти статьи не сами пишут, а сдирают с других ресурсов буржунета
|
|
05.08.2011, 23:27
|
Особый гость
|
|
Регистрация: 02.04.2010
Сообщений: 4,260
|
|
Есть очень легкий, мощный и шустрый парсер PUGIXML
Последний раз редактировалось monolithed, 05.08.2011 в 23:30.
|
|
06.08.2011, 21:46
|
|
Модератор Всея Форума
|
|
Регистрация: 14.05.2009
Сообщений: 4,021
|
|
Сообщение от monolithed
|
откуда такая информация?
|
Говорили на прошлом WebHiTech. Имя чувака вспомнить не могу, он ещё обещал выложить тесты.
Сообщение от Kolyaj
|
Нет в стандарте разрешения так писать.
|
Есть. Говорили на HTML5 Camp
__________________
Болтовня ничего не стоит. Покажите мне код. — Linus Torvalds
влад.куркин.рф
|
|
06.08.2011, 22:05
|
Новичок на форуме
|
|
Регистрация: 19.02.2008
Сообщений: 9,177
|
|
Сообщение от B~Vladi
|
Говорили на HTML5 Camp
|
В таких случаях лучше ссылку на соответствующее место в стандарте давать
|
|
07.08.2011, 00:50
|
|
Модератор Всея Форума
|
|
Регистрация: 14.05.2009
Сообщений: 4,021
|
|
Сообщение от Kolyaj
|
В таких случаях лучше ссылку на соответствующее место в стандарте давать
|
Я знаю, мне влом. Вы же все так любите новый стандарт - должны знать спеку. Вот сами и найдите.
__________________
Болтовня ничего не стоит. Покажите мне код. — Linus Torvalds
влад.куркин.рф
|
|
|
|