Javascript-форум (https://javascript.ru/forum/)
-   Общие вопросы Javascript (https://javascript.ru/forum/misc/)
-   -   Прошу помочь со сложным регулярным выражением (https://javascript.ru/forum/misc/83991-proshu-pomoch-so-slozhnym-regulyarnym-vyrazheniem.html)

Laks 09.05.2022 08:19

Прошу помочь со сложным регулярным выражением
 
Здравствуйте!
Я не программист. Так, начинающий любитель. Поэтому можете сразу кинуть в меня тапок. Для начала.
Суть вопроса:
я давно подсел на один MUD. И захотел максимально его автоматизировать , используя js.
Однако столкнулся с ситуацией, когда просто не смог создать одно (ну два) регулярное выражение, которое бы матчило определенные места строк типа:
Bobby pierces an elite guard very hard.
Bobby pierces an elite guard extremely hard.
Bobby pierces an elite guard.
Bobby barely pierces an elite guard.
An elite guard pierces Bobby very hard.
An elite guard pierces Bobby extremely hard.
An elite guard pierces Bobby.
An elite guard barely pierces Bobby.

Из этих строк надо выбрать «Bobby» и «An elite guard». Причем в «An elite guard» могут быть символы «’» «,» «-» (например «En’gla, master of maces») и состоять оно может как из нескольких слов, так и из одного.

Сам я смог родить только подобное:
/^(\w+)\s(cleav|crush|slash|bludgeon|claw|drain|hit |pierc|shoot|sting|whip|bit|smit|stab)(e|es|s)\s([\w\s\'\-\,]+)(?:.|very|extrem)/
/^([\w\s\'\-\,]+)\s(?:barely)\s?(cleav|crush|slash|bludgeon|claw| drain|hit|pierc|shoot|sting|whip|bit|smit|stab)(e| es|s)\s(\w+)(?: very| extrem)/
но оно не работает корректно (сутками сидел, пытаясь переделывать так или иначе).
Может быть вы сможете мне помочь в написании регэкспа для моей задачи? Буду вам очень благодарен.

рони 09.05.2022 08:31

Laks,
подожду переводчика, а пока что на входе и что на выходе, напишите пожалуйста.

Laks 09.05.2022 08:49

Цитата:

Сообщение от рони (Сообщение 545202)
Laks,
подожду переводчика, а пока что на входе и что на выходе, напишите пожалуйста.

На входе строки типа:
Bobby pierces an elite guard very hard.
Bobby pierces an elite guard extremely hard.
Bobby pierces an elite guard.
Bobby barely pierces an elite guard.
An elite guard pierces Bobby very hard.
An elite guard pierces Bobby extremely hard.
An elite guard pierces Bobby.
An elite guard barely pierces Bobby.

На выходе надо получить:
Bobby
An elite guard

Или я не понял ваш вопрос?

Во входящих строках есть всегда "pierces " или "drains" или "bites" или любое другое из списка cleav|crush|slash|bludgeon|claw| drain|hit|pierc|shoot|sting|whip|bit|smit|stab.
Так же могут присутствовать "barely", "very hard", "extremely hard", "hard".
Причем если есть "barely" в строке, то нет "very hard", "extremely hard", "hard" и наоборот.
Я смог добиться получения из входящих строк "An elite guard" но не совсем корректно, вместо "An elite guard" в переменную пишется "An elite guard very hard" например. А с "barely" вообще засада - никак не получается...

Laks 09.05.2022 09:48

Прочитав много постов тут у меня родилась мысль, которая реализовалась в такого монстра:
/^(\w[\w\s\'\-\,]+)\s(?:barely cleav|barely crush|barely slash|barely bludgeon|barely claw|barely drain|barely hit|barely pierc|barely shoot|barely sting|barely whip|barely bit|barely smit|barely stab|cleav|crush|slash|bludgeon|claw|drain|hit|pie rc|shoot|sting|whip|bit|smit|stab)(?:e|es|s)\s(\w[\w\s\'\-\,]+)./

Но добиться того, чтобы "very hard", "extremely hard", "hard" не матчились так и не получилось...

добавление к вышенаписанному регэкспу (?:.| extremely hard| very hard| hard) ломает работоспособность.

рони 09.05.2022 11:33

Laks,
увы, не осилил, может кто-то другой, вам поможет выделить нужное из строк.

Белый шум 09.05.2022 11:45

Laks, если не то - формулируйте задачу яснее и лаконичнее.

var text = ["Bobby pierces an elite guard very hard.",
"Bobby pierces an elite guard extremely hard.",
"Bobby pierces an elite guard.",
"Bobby barely pierces an elite guard.",
"An elite guard pierces Bobby very hard.",
"An elite guard pierces Bobby extremely hard.",
"An elite guard pierces Bobby.",
"An elite guard barely pierces Bobby."];

function getBobby(txt) {
  alert( txt.match(/bobby|an elite guard/ig) );
}

text.forEach(getBobby);

Laks 09.05.2022 13:15

Так Бобби и элитный гвард - это переменные значения входящего текста, которые могут быть любыми, исходя из условий выше.
Так что такой вариант - не вариант ))

Laks 09.05.2022 13:18

Цитата:

Сообщение от Laks
/^(\w[\w\s\'\-\,]+)\s(?:barely cleav|barely crush|barely slash|barely bludgeon|barely claw|barely drain|barely hit|barely pierc|barely shoot|barely sting|barely whip|barely bit|barely smit|barely stab|cleav|crush|slash|bludgeon|claw|drain|hit|pie rc|shoot|sting|whip|bit|smit|stab)(?:e|es|s)\s(\w[\w\s\'\-\,]+)./

придется в теле функции, которая это дело обрабатывает после получения переменных, заменять "hard", "very hard", "extremely hard" на пустое место...
типа такого:
var st1 = "";
st1 = name1.replace(/ hard/, "");
st1 = st1.replace(/ very/, "");
st1 = st1.replace(/ extremely/, "");
st1 = st1.replace(/ barely/, "");

Но костыли всегда ведут к ошибкам в коде (((

Может найдется профессор, кто сможет мой регэксп доработать?? Просто я уже все...

рони 09.05.2022 13:19

Цитата:

Сообщение от Laks
, исходя из условий выше.

:-?

Белый шум 10.05.2022 00:41

Laks,
последняя попытка понять ваш незамутнённый поток разума: кто-то кого-то протыкает и надо получить никнейм того, кто это делает, так? Т.е. получить часть текста до "pierces" или "barely pierces", да?


Часовой пояс GMT +3, время: 20:38.