Javascript-форум - Вырезать регуляркой

Javascript-форум (https://javascript.ru/forum/)

- Серверные языки и технологии (https://javascript.ru/forum/server/)

- - Вырезать регуляркой (https://javascript.ru/forum/server/4415-vyrezat-regulyarkojj.html)

просто чем отличаются эти два варианта: тем, что жадная регулярка сначала найдет самое жадное совпадение. Что общего: обе регулярки будут для каждого символа проверять шаблон, жадная - с конца, нежадная - с начала. Т.е. расклады могут быть разные. Так что имхо неочевидно, что быстрее

Цитата:

Сообщение от x-yuri

Так что имхо неочевидно, что быстрее

Если еще немного подумать, то не жадная 100% медленней.

x-yuri, +1

Из вики:

Цитата:

Разница в реализации

При необходимости обработать жадный элемент шаблона, парсер начинает поиск соответствия с конца обрабатываемой строки; при обработке нежадного элемента, проверка производится с текущего места обработки строки до первого несоответствия.

Жадные будут быстрее далеко не всегда. Например, тут:
/a[\w\d]*\d/.test('a1bcdefghjk') -- схватили первое 'a', потом залезли в конец и начали отматывать аж до 'b'. Нежадный схватил бы пустую строку, не нашел за ней цифру, взял 'b' и готово.

Цитата:

Сообщение от e1f

парсер начинает поиск соответствия с конца обрабатываемой строки

Что за бред? Это было бы логично только для .* с модификатором m.

Цитата:

Сообщение от e1f

схватили первое 'a'

Все так.

Цитата:

Сообщение от e1f

потом залезли в конец

Верно.

Цитата:

Сообщение от e1f

начали отматывать аж до 'b'

А вот здесь никуда ничего не отматывается, здесь конец строки не соответствует куску \d и регулярка выдает false.

Цитата:

Сообщение от e1f

Нежадный схватил бы пустую строку, не нашел за ней цифру, взял 'b' и готово.

Здесь сначала берется первое "а", затем \d успешно примеряется к "1" и раз успешно, то куску [\w\d]*? ничего не достается, т. е. соответствие найдено и результат true.

А раз результаты на тестируемом тексте разные, значит сравнивать производительность таким тестом не корректно.

Цитата:

Сообщение от e1f

Из вики:

Кто-то с похмелья туда написал.

Результаты разные? А запускать не пробовали?

>>> /a[\w\d]*\d/.test('a1bcdefghjk')
true
>>> /a[\w\d]*?\d/.test('a1bcdefghjk')
true

В варианте 2 и Вы, и я сказали то же самое :) А вот в варианте 1 именно отматывается
Kolyaj,

Цитата:

парсер начинает поиск соответствия с конца обрабатываемой строки

здесь неточно. имеется в виду с конца максимального совпадения на данном этапе. То есть /a.*b/.test('ab11111111111111111...') отхватит все с b до конца, и только потом начнет обратно ползти

Конец максимального совпадения тоже еще найти надо. Но вы правы в том, что нужно просто знать, где какой квантификатор использовать.

Цитата:

Сообщение от e1f

начнет обратно ползти

И правда, назад еще ползает :blink: .
Ладно, сдаюсь :) .