поиск необязательного значения с помощью рег выражения
Добрый день
Помогите с рег выражением есть элементы в тексте которые есть всегда (text1 и text3), а часть может присутствовать или нет (text2) упростил выражение, для публикации тут: /(text1).*?(text2)?.*?(text3)/ где text2 - это тот текст, который как может быть в строке, так может и отсутствовать но даже если он присутствует, выражение его не сохраняет в найденных что делаю не так? <script> var str='text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3', rx=/(text1).*?(text2)?.*?(text3)/; document.write(rx.exec(str).join('<br>')); </script> |
Если по условию text2 может и быть, и отсутствовать, то проверять его наличие нет смысла, проверяйте только наличие text1 и text3.
|
данное регулярное выражение - не проверяет наличие или отсутствие текста, оно выдирает (парсит) из текста искомые данные
З.Ы. проверять оно конечно проверяет, на соответствие основным элементам, но выдернуть нужно все, в том числе и те данные, которых может и не быть, при их наличии |
Cache,
<script> var str='text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3', rx=/(text1|text2|text3)/g; document.write(str.match(rx).join('<br>')); </script> |
рони,
это не совсем то, я не просто так упомянул, что рег. выражение сильно упрощено как я понимаю, иных вариантов нет? либо выдергивать кусок текста между text1 и text3, и уже его обрабатывать отдельным рег выражением? |
Цитата:
|
рони,
потому что парсится код таблицы и text1 и text3 находятся в одной строке (если вообще есть) если делать через или получу кашу из значений |
Cache,
match == null ничего не найдено match.length == 2 text2 нет match.length == 3 text2 = match[1] |
Cache,
<script> var str='text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3', rx=/(^text1|text2|text3$)/g, match = str.match(rx)||[]; document.write(match.length ===3 && match[1]); </script> |
рони,
<script> var str='text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3 text1 aaaaa aa aaa aaaa aaa aaa a aaaa aaaa aaaa aaa aaa text3 text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3', rx=/(^text1|text2|text3$)/g, match = str.match(rx)||[]; document.write(match); </script> а должно было быть так: text1,text2,text3,text1,text3,text1,text2,text3 |
рони,
не заметил что вы поставили ограничители начала и конца строк рони, <script> var str='text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3 text1 aaaaa aa aaa aaaa aaa aaa a aaaa aaaa aaaa aaa aaa text3 text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3', rx=/(text1|text2|text3)/g, match = str.match(rx)||[]; document.write(match); </script> вот так, да все верно Спасибо |
/(text1|text2|text3)/g - совсем не то же самое, что регулярка в стартовом посте. Здесь куски находятся по отдельности, а там - именно как составная конструкция.
в стартовом посте text2 не вылавливается из-за нежадности. Первая .*? забирает пустую подстроку, потом не находится text2, далее .*? растягивается до text3, и всё. Регулярка не замотивирована найти text2 в середине. самый простой (но не факт, что универсальный) способ допилки стартового регекса: var rx = /(text1)(?:.*?(text2))?.*?(text3)/; function exec(str) { var m = rx.exec(str); if (!m) { return alert([str, '', 'not matched'].join('\n')); } alert([str, '', m[1], m[2], m[3]].join('\n')); } exec('aaaa text1 aaaaa text2 aaaa text3 aaaa'); exec('aaaa text1 aaaaa aaaa text3 aaaa'); exec('aaaa text1 aaaaa text2 aaaa aaaa'); |
Alexandroppolus,
спасибо, возьму на вооружение |
Cache,
вообще говоря, моя регулярка может облажаться, если в строке несколько совпадений: 'text1 a text3 aaaa text1 a text2 a text3' здесь (?:.*?(text2)) жадничает в попытке найти text2, и проскакивает text3. Поправка: /(text1)(?:(?:(?!text3).)*?(text2))?.*?(text3)/- теперь мы проверяем точки, чтобы не проскочить. |
Цитата:
laimas иногда провозглашает удивительнейшие вещи! Диковинка! Цитата:
<script> var str='text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3', rx=/(text1)(?:.*(text2).*|.*)(text3)/; document.write(rx.exec(str).join('<br>')); </script> |
Цитата:
<script> var str = "text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3 text1 aaaaa aa aaa aaaa aaa aaa a aaaa aaaa aaaa aaa aaa text3 text1 aaaaa aa aaa aaaa aaa aaa a text2 aaaa aaaa aaaa aaa aaa text3"; var result = str.split(/(text1|text2|text3)/).filter(function(v, i) { return i % 2 === 1 }); document.write(result); </script> |
Часовой пояс GMT +3, время: 20:03. |