Показать сообщение отдельно
  #1 (permalink)  
Старый 13.09.2023, 15:01
Интересующийся
Отправить личное сообщение для accountnujen Посмотреть профиль Найти все сообщения от accountnujen
 
Регистрация: 23.01.2022
Сообщений: 17

Почему не регуляркой находится кириллический домен и как учитывать домены 2 уровня?
Я хочу найти в тексте все ссылки и обернуть их в тег <a>. Ссылки у меня могут иметь вид: https://google.com, www.google.com, google.com, гугл.рус, поиск.гугл.рус.

На пару с chatgpt удалось добиться только вот такого результата:
Код:
\b[A-Za-zА-Яа-яЁё]*[A-Za-zА-Яа-яЁё]+[.][A-Za-zА-Яа-яЁё]{2,}\b
https://regex101.com/r/4QwNjk/1

Логика была изначально такой: найти всё, что разделено точкой, так как привязываться к https или к www не хочется.

В данном случае, почему то не находится гугл.рус, хотя кириллица указана и от 2 символов...
Как захватывать всё то, что находится до точки (включая http://) - не знаю, а gpt меня не понимает.
Ответить с цитированием