Javascript-форум (https://javascript.ru/forum/)
-   Элементы интерфейса (https://javascript.ru/forum/dom-window/)
-   -   Помогите исправить регулярное выражение (https://javascript.ru/forum/dom-window/82805-pomogite-ispravit-regulyarnoe-vyrazhenie.html)

Vaska 08.07.2021 09:59

Помогите исправить регулярное выражение
 
Приветствую!
Применяю регулярное выражение, для номера телефона
((\+?\d{1,3}[\d{2,}\.\- \(\)]{11,}))|(\+?[\d]{10,})/gm

По задумке, должно работать только с телефонами состоящими из 10 и 11 цифр.
В данном виде, видит цифры которые больше 9 цифр.
Однако в этом регулярном выражении есть недостаток, выражение цепляет цифры, в которых больше 11 цифр.
Можно исправить выражение, чтобы оно не работало с цифрами, у которых больше 11 цифр? А работало только с цифрами от 10-11.

Заранее спасибо, за помощь!

ksa 08.07.2021 11:32

Vaska, приведи примеры "правильных" номеров и "не правильных"...

Vaska 08.07.2021 12:45

ksa,
Здесь тестировалось выражение https://regex101.com/r/IJX37n/1
Это выражение я применю, чтобы вырезать из текста номера телефонов написанного в разных вариантах.

Однако, в тексте, на сайте, вставляются фотки, у которых название 1_2017092902182426089.jpg, 123451_2017092902182426089.png.
выражение вырезает из названия фотки 11 символов.
Это нужно бы пофиксить.

ksa 08.07.2021 13:50

Цитата:

Сообщение от Vaska
на сайте, вставляются фотки, у которых название 1_2017092902182426089.jpg, 123451_2017092902182426089.png.
выражение вырезает из названия фотки 11 символов.
Это нужно бы пофиксить.

Т.е. тебе нужно из таких названий взять какие-то 11 цифр?
Каких именно?
11 последних?

Vaska 08.07.2021 14:49

Цитата:

Сообщение от ksa (Сообщение 538511)
Т.е. тебе нужно из таких названий взять какие-то 11 цифр?
Каких именно?
11 последних?

Нет, мне нужно, чтобы регулярное выражение не трогало имена файлов, в которых есть цифры.
Задача, с помощью регулярного выражения вырезать из текста номера телефонов, а другие данные, не трогать.
А сейчас регулярное выражение вырезает из названия файла изображений кусок названия. И пути к файлам фоток получаются битые. Это неправильно.

ksa 08.07.2021 14:52

Цитата:

Сообщение от Vaska
мне нужно, чтобы регулярное выражение не трогало имена файлов, в которых есть цифры

Тогда покажи примеры текстов, где есть телефоны и те имена файлов...

Vaska 08.07.2021 15:00

ksa,
по ссылке же есть весь комплект.

Vaska 08.07.2021 15:02

ksa,
Там в результате работы выражения, получается:
Цитата:

1_убито jpg
123451_убито png
А должно быть не убито
Цитата:

1_2017092902182426089.jpg
123451_2017092902182426089.png

ksa 08.07.2021 15:57

Цитата:

Сообщение от Vaska
по ссылке же есть весь комплект

Я по ссылкам не хожу... :no:

Цитата:

Сообщение от Vaska
А должно быть не убито

Я понял твою проблему. Осталось увидеть текст, который ты обрабатываешь...

Vaska 08.07.2021 16:21

Цитата:

Сообщение от ksa (Сообщение 538517)
Я по ссылкам не хожу... :no:

По ссылке сервис по отладке регулярок, все там отлаживают.
Ну если ты им не пользуешься, то тогда вот текст:
Цитата:

Вариантов написания телефонов достаточно много.
Телефоны имеют разное количество цифр: 10, 11, 12.
Разное написание:
+7 999 999 99 99
7 999 999 99 99
+7999 999 99 99
7999 999 99 99
+7999-999-99-99
7999-999-99-99
+7999-999-9999
7999-999-9999
+7999-9999999
7999-9999999
+79999999999
79999999999
+7.999.999.99.99
+7(999) 999-99-99
+123 (999) 555-66-29
+555 (999) 555-66-29
и вместо цифры страны с оной цифрой 7, есть коды по 2 и по 3 цифры.
Можно придумать и ещё много вариантов написания номера телефона.
Как это всё учесть в выражении?
В тексте могут содержаться ссылки на фотографии и ссылки на страницы сайта, в которых могут быть цифры. Как не зацепить цифры в ссылках? Как их отсортировать от номеров телефонов?
1_2017092902182426089.jpg
123451_2017092902182426089.png

ksa 08.07.2021 19:35

Цитата:

Сообщение от Vaska
все там отлаживают

Далеко не все... :D

Цитата:

Сообщение от Vaska
Как не зацепить цифры в ссылках? Как их отсортировать от номеров телефонов?

Потому и прошу показать как выглядит твой текст. Зная с какими данными имеешь дело - можно придумать как правильно забрать нужное. ;)

Пока посмотрю что можно сделать с тем текстом, что ты показал.

ksa 08.07.2021 20:05

Цитата:

Сообщение от Vaska
вот текст

Этот текст можно обработать такой регуляркой

<textarea id='test'>
Вариантов написания телефонов достаточно много.
Телефоны имеют разное количество цифр: 10, 11, 12.
Разное написание:
+7 999 999 99 99
7 999 999 99 99
+7999 999 99 99
7999 999 99 99
+7999-999-99-99
7999-999-99-99
+7999-999-9999
7999-999-9999
+7999-9999999
7999-9999999
+79999999999
79999999999
+7.999.999.99.99
+7(999) 999-99-99
+123 (999) 555-66-29
+555 (999) 555-66-29
и вместо цифры страны с оной цифрой 7, есть коды по 2 и по 3 цифры.
Можно придумать и ещё много вариантов написания номера телефона.
Как это всё учесть в выражении?
В тексте могут содержаться ссылки на фотографии и ссылки на страницы сайта, 
в которых могут быть цифры. 
Как не зацепить цифры в ссылках? 
Как их отсортировать от номеров телефонов?
1_2017092902182426089.jpg
123451_2017092902182426089.png
</textarea>
<div id='info'></div>

<script>
const txt = document.querySelector('#test').value
const re = /\+?[\d\s\-\.()]{11,19}(?=[\n])/gm
document.querySelector('#info').innerHTML = txt.match(re).join('<br />')
</script>

ksa 08.07.2021 20:08

Цитата:

Сообщение от Vaska
По ссылке сервис по отладке регулярок, все там отлаживают.

Сразу видно что у тебя не математическое образование... :D
Термин "все" подразумевает полное отсутствия иного.

А на тот сервис не хожу не только я, но и еще огромная толпа других людей. ;)
Т.е. это уже "далеко не все" там бывают.

ksa 08.07.2021 20:20

Цитата:

Сообщение от Vaska
вот текст

И вот так можно работать с тем текстом...

<textarea id='test'>
Вариантов написания телефонов достаточно много.
Телефоны имеют разное количество цифр: 10, 11, 12.
Разное написание:
+7 999 999 99 99
7 999 999 99 99
+7999 999 99 99
7999 999 99 99
+7999-999-99-99
7999-999-99-99
+7999-999-9999
7999-999-9999
+7999-9999999
7999-9999999
+79999999999
79999999999
+7.999.999.99.99
+7(999) 999-99-99
+123 (999) 555-66-29
+555 (999) 555-66-29
и вместо цифры страны с оной цифрой 7, есть коды по 2 и по 3 цифры.
Можно придумать и ещё много вариантов написания номера телефона.
Как это всё учесть в выражении?
В тексте могут содержаться ссылки на фотографии и ссылки на страницы сайта, 
в которых могут быть цифры. 
Как не зацепить цифры в ссылках? 
Как их отсортировать от номеров телефонов?
1_2017092902182426089.jpg
123451_2017092902182426089.png
</textarea>
<div id='info'></div>

<script>
const txt = document.querySelector('#test').value
const re = /[+\d\u0020\-\.()]{5,}(?=[\n])/gm
document.querySelector('#info').innerHTML = txt.match(re).join('<br />')
</script>

Vaska 08.07.2021 22:27

ksa,
ни первое, не второе выражение не работает,
ни в PHP
$exge = '/\+?[\d\s\-\.()]{11,19}(?=[\n])/m';
$html = preg_replace($exge, '', $html);

не в JS.
$.validator.addMethod('removeTel', function(value, element) {
	return !/\+?[\d\s\-\.()]{11,19}(?=[\n])/gm.test(value)
},
'Размещать телефоны запрещено');

Хотя в песочнице, видит почти все варианты написания телефонов, кроме варианта +555 (999) 555-66-29. Его не видит.

Если одно и то же выражение не работает одинаково и одновременно в PHP и в JS, тогда это не то, что мне нужно.
Выражение, которое я хотел бы исправить, из первого сообщения, - работает одинаково и там и там.

В первом выражении вообще ошибка /[+\d\u0020\-\.()]{5,}(?=[\n])/gm
Вместо u, возможно, предполагалось w.
Даже исправив ошибку /[+\d\w0020\-\.()]{5,}(?=[\n])/gm, выражение не видит половины вариантов написания телефонов.

ksa 09.07.2021 08:02

Цитата:

Сообщение от Vaska
не второе выражение не работает

Я тебе прямо тут его запускаю и оно работает. :D
Цитата:

Сообщение от Vaska
это не то, что мне нужно

Это уже твое дело...

Мое выражение прекрасно работает в JS на примере твоего текста.

echovid 03.08.2021 15:09

нужно от таких имен брать какие-то 11 цифр? vidmate instasave


Часовой пояс GMT +3, время: 09:55.