Javascript-форум (https://javascript.ru/forum/)
-   Ваши сайты и скрипты (https://javascript.ru/forum/project/)
-   -   О, чо написал. (https://javascript.ru/forum/project/12913-o-cho-napisal.html)

Kolyaj 07.09.2011 18:34

Да, кстати, предполагается, что решение будет только с регулярками, без всяких callback-функций.

B~Vladi 07.09.2011 18:37

Есть один недочет. Не найдет такой код:
<nts:as asd jhg=321 asd:as=" ' asd:fake_attr " asd:as = ' " asd:fake_attr ' />

Но его легко поправить, поэтому я оставлю эту задачу для вас :)
Цитата:

Сообщение от Kolyaj
Да, кстати, предполагается, что решение будет только с регулярками, без всяких callback-функций.

Регулярка способна обработать за один раз - один тег. Без функции никак. Например с таким кодом можно:
string.replace(reg, function(){/* тут вся магия */});

Цитата:

Сообщение от Kolyaj
Давай начнём с простого, проверка правильности расстановки скобок одного типа.

Вот тут не понял, это что ещё за скобки и типы?

Kolyaj 07.09.2011 18:46

Ну ты сказал, что регулярками определишь вложенность тегов, скобки те же теги.

Я не сразу понял, какая у тебя задача. Как я понимаю, это выловить во входном потоки все теги? Вложенность будет проверять какой-то другой механизм.

B~Vladi 07.09.2011 18:51

Цитата:

Сообщение от Kolyaj
Ну ты сказал, что регулярками определишь вложенность тегов, скобки те же теги.

Понял.
Цитата:

Сообщение от Kolyaj
Как я понимаю, это выловить во входном потоки все теги?

Ну не просто выловить все теги, а ещё разобрать их на составляющие. Например, можно использовать для подсветки. Вложенность проверяется js-логикой, при нахождении очередного тега.

Kolyaj 07.09.2011 18:51

А чем плох простой?
Код:

/<("[^"]*"|'[^']'|[^>])+>/
UPD: понял, составляющие ещё нужны. Хотя проще, наверное, составляющие отдельно вытаскивать.

B~Vladi 07.09.2011 19:01

Цитата:

Сообщение от Kolyaj
А чем плох простой?

Ещё тем, что это найдет синтаксически сломанные теги. Получаются расхождения с парсерами браузеров. Хотя они тоже по-разному парсят, если синтаксис нарушен.
Цитата:

Сообщение от Kolyaj
Хотя проще, наверное, составляющие отдельно вытаскивать.

Ещё пятью регулярками и парой функций? Не думаю.

Kolyaj 07.09.2011 19:13

Пять простых регулярок лучше, чем одна сложная.

B~Vladi 07.09.2011 20:41

Цитата:

Сообщение от Kolyaj
Пять простых регулярок лучше, чем одна сложная.

Простыми не получится. Например, твоя регулярка упадет на этом:
<!--
<div asdasas="">
-->

Комментарии не должны обрабатываться. Ещё есть инлайновые скрипты, стили, так что...

Пока ехал домой, мысленно нашел несколько багов, завтра исправлю.

B~Vladi 07.09.2011 21:09

Исправил баги:
/(?:<!--([\s\S]*?)-->)|(?:<!\[CDATA\[([\s\S]*?)\]\]>)|(?:<\/[\s\n\r]*([a-z\-_]+)(?::([a-z\-_]+))?[\s\n\r]*>)|(?:<[\s\n\r]*([a-z\-_]+)(?::([a-z\-_]+))?((?:[\s\n\r]+[a-z\-_]+(?::[a-z\-_]+)?[\s\n\r]*(?:=[\s\n\r]*(?:(?:"[^"]*")|(?:'[^']*')|(?:([^\s]+))))?)*)[\s\n\r]*(\/)?>)/gi

Сейчас всё должно быть тип топ. Только соответствующим образом нужно изменить регулярку по атрибутам.

9xakep 16.11.2011 17:05

А где может использоваться вся эта писанина?


Часовой пояс GMT +3, время: 07:01.