О, чо написал.
/(?:<!--([\s\S]*?)-->)|(?:<!\[CDATA\[([\s\S]*?)\]\]>)|(?:<(\/)?([\w\-_]+)(?::([\w\-_]+))?((?:[\s]*[\w\-_]+(?::[^=]+)?="[^"]*")*)\s*(\/)?>)/gi В replace, например, попадут аргументы: result, isComment, isCDATA, isCloseTag, prefix, name, attributes, isEmptyTag, index Разбор attributes: /[\s]*([\w\-_]+)(?::([^=]+))?="([^"]*)"/gi Аргументы: result, prefix, name, data, index :D Хз, может кому и понадобиться.:write: |
сакс парсер пишешь? х)
|
Цитата:
Регулярки же у нас во всех языках перловые. Пусть останется на просторах интернета, т.к. я больше нигде не видел такого. |
<option selected> ? а такое попадает
|
Ах, да, забыл написать, что текст должен быть валидным xml. Нет, не попадает. Но при желании поправить можно.
|
Теперь любой сможет с лёгкостью найти эти бесценные строки в гугле по запросу "о, чо написал" :)
|
О, ещё чо написал: :write:
Теги: /(?:<!--([\s\S]*?)-->)|(?:<!\[CDATA\[([\s\S]*?)\]\]>)|(?:<\/\s*([a-z\-_]+)(?::([a-z\-_]+))?\s*>)|(?:<\s*([a-z\-_]+)(?::([a-z\-_]+))?((?:\s*[a-z\-_]+(?::[a-z\-_]+)?\s*(?:=\s*(?:(?:"[^"]*")|(?:'[^']*')))?)*)\s*(\/)?>)/gi Атрибуты: /(?:\s*([a-z\-_]+)(?::([a-z\-_]+))?\s*(?:=\s*(?:(?:"([^"]*)")|(?:'[^']*')))?)*/gi Это для HTML. Корректно отрабатывает, например, такой код: <nts:as asd asd:as=" ' asd:fake_attr " asd:as = ' " asd:fake_attr ' /> Вообще сказать, везде пишут что парсинг HTML-кода регулярками великое зло, в том числе на stack overflow и хабре. Может потому что не справились?... Если кто найдет ошибку - дайте знать :) |
Цитата:
Цитата:
|
Цитата:
Цитата:
|
Давай начнём с простого, проверка правильности расстановки скобок одного типа.
var str = '()((()())(())()(()))'; // например |
Часовой пояс GMT +3, время: 11:48. |