Javascript-форум (https://javascript.ru/forum/)
-   Общие вопросы Javascript (https://javascript.ru/forum/misc/)
-   -   RegEx / Match (https://javascript.ru/forum/misc/35564-regex-match.html)

gJam 14.02.2013 18:32

RegEx / Match
 
Добрый день!

В соседнем топике решился вопрос с нахождением всех элементов удовлетворяющих RegEx'у (с помощью match), но применив на практике столкнулся с рядом проблем:

Массив который мы получаем более чем на 50% состоит из пустых элементов - но это мелочи, но так же мы ловим странные элементы, хотя на онлайн-тестерах RegEx'ов, да и на своей практике - все работает верно, что делать?

Регулярка:
Код:

^(((https?)|(ftp)):\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$
Цель: найти все ссылки в строке с путями или без, а так же в различном написании (http/https/ftp) и с www или без

Код:

http://www.sitename.domain/dir/dir2/file.jpg
www.sitename.domain/dir/file.jpg
dasd.asdas/~sad.js
sub.sitename.domain/dir/dir2/file.jpg
site.do/file.pjg
htttp://google.com/ansdjnaskd/najskd/inasd.jf
https://go.do/dir/file.png
ftp://site.dom/file.blah_blah

корректно работает на этом

Но например ссылку site.do/file.pjg и текст polly (site.do/file/pjg polly)
Match видит как:
Код:

site.do/file/pjg polly| undefined| undefined| undefined| undefined| site| do| /file/pjg polly| undefined|
Где | - разделитель элементов массива

С двумя/более ссылками в строке - тихий ужас

nerv_ 14.02.2013 18:39

что на входе?

gJam 14.02.2013 19:00

Цитата:

Сообщение от gJam (Сообщение 234022)
site.do/file/pjg polly

это

nerv_ 14.02.2013 19:11

Цитата:

Сообщение от gJam
Цель: найти все ссылки в строке

вся строка какая?

gJam 14.02.2013 19:22

Ввожу:
site.do/file/pjg polly
Получаю массив разделенный |
site.do/file/pjg polly| undefined| undefined| undefined| undefined| site| do| /file/pjg polly| undefined|

рони 15.02.2013 01:01

gJam,
str = 'http:\/\/www.sitename.domain\/dir\/dir2\/file.jpg \
http:\/\/www.sitename.domain\/dir\/file.jpg \
dasd.asdas\/~sad.js \
sub.sitename.domain\/dir\/dir2\/file.jpg \
site.do/file.pjg \
htttp:\/\/google.com\/ansdjnaskd\/najskd\/inasd.jf \
https:\/\/go.do\/dir\/file.png \
site.do/file/pjg polly \
ftp:\/\/site.dom\/file.blah_blah'
reg = /(^|\s)(((https?)|(ftp)):\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})(\/[~\w\.-]*)*\/?/gim
alert(str.match(reg).join('\n'))

Deff 15.02.2013 03:17

function LinkRepL (a) {
  var b = a.split(/^(?:[^.:\/]*?[.:])?(?:\/\/){0,1}|\/(?!\/)/ig).join('|');
  if(b==a) return false;
  return b;
}

var arr =[ 
'//www.sitename.domain/dir/dir2/file.jpg',
'http://www.sitename.domain/dir/dir2/file.jpg',
'www.sitename.domain/dir/file.jpg',
'dasd.asdas/~sad.js',
'sub.sitename.domain/dir/dir2/file.jpg',
'site.do/file.pjg',
'htttp://google.com/ansdjnaskd/najskd/inasd.jf',
'https://go.do/dir/file.png',
'ftp://site.dom/file.blah_blah'
]
for (var i=0; i<arr.length; i++) {
   alert(LinkRepL (arr[i]) );
}


Часовой пояс GMT +3, время: 15:21.