Javascript-форум (https://javascript.ru/forum/)
-   Серверные языки и технологии (https://javascript.ru/forum/server/)
-   -   Составить регулярное выражение (https://javascript.ru/forum/server/57157-sostavit-regulyarnoe-vyrazhenie.html)

Гробовщик 22.07.2015 12:38

Составить регулярное выражение
 
Здравствуйте уважаемые форумчане.
К сожалению мой мозг ну никак не может (или не хочет) понять логику.
Короче есть у меня в файле .csv столбец с данными типа
Код:

02.04 - созвон
07.04 - встреча
08.04 - созвон
14.04 - созвон
16.04 - созвон
17.04 - встреча
20.04 - созвон
21.04 - созвон
24.04 - созвон

Разумеется читается эта запись одной строкой
Вроде всё просто 2 цифры, точка, 2 цифры, пробел, тире, пробел и буквы, но сложность в том, что:
Цифры могут идти через запятую или тире
После них может идти точка
Разумеется не факт что после и перед тире стоит запятая
Да и вместо "созвон" может быть слово "совбон" или "созвон с поставщиком"
Мне же всю эту конструкцию надо разбить на "дата - событие"
Дата только формата "24.04" а после тире слово "созвон" или "встреча"
Может у кого есть дельный совет по этому поводу, как привести к одному формату да ещё и "разбить" на разные строки

Deff 22.07.2015 14:17

Гробовщик,
Выложите все возможные Варианты для одной строчки:
02.04 - созвон

Гробовщик 22.07.2015 14:50

Deff, ну файлик писался для понимания человеком, а потому писался "кто во что горазд". Вот варианты, которые впринципе можно отловить программно
02.04 созвон
07,04 - встреча
08-04 - созвон
14.04.15 - созвон в 3 часа
Ну и разнообразие, где то тире отсутствует, где то пробелы. Всё не соберёшь. Мне необходимо отловить как можно больше вариантов, что бы потеря данных была как можно меньше.
в целом мне и надо то отловить число и событие к нему, потом добавить в базу

tysonfury2015 22.07.2015 15:13

>>Да и вместо "созвон" может быть слово "совбон"
это, по-моему, алгоритмически-неразрешимо.

остальное как-то так.
alert(
"02.04. - созвон\n02-01-встреча\n02,04 - созвон, fuck\n02-04 - fuck встреча"
 .match(/(\d\d[.,-]\d\d)\.? ?- ?([^\n]+)/g)
 .map(function(s){return s.replace(/^(\d\d)[.,-](\d\d)/, "$1.$2")})
 .map(function(s){return s.replace(/^(\d\d\.\d\d)(\.? ?- ?)(.+)/, function(s, sub1, sub2, sub3){
   return sub1+"-"+sub3.match(/созвон|встреча/)[0]
  })})

)

Если описание дано верно, должно работать

PS
Цитата:

14.04.15 - созвон в 3 часа
Этого вроде, не было, в изначальном варианте. Подозреваю, что Вы не указали еще тыщенку-другую. При таком раскладе, Вашу задачу решить невозможно, если вы сами не знаете, что хотите.

kostyanet 22.07.2015 15:24

Сначала все нормализуется, проверяется, потом хавается как обычно. В порядке ремонта. В рабочем порядке таких задач не может возникать. Или это делают не рабочие, а какие-то недоумки.

tysonfury2015 22.07.2015 15:26

kostyanet,
Такая задача может возникнуть при парсинге данных с левых сайтов, для аналитики.

kostyanet 22.07.2015 15:31

Еще раз, тырить контент это не задачи и там реги вообще не нужны. Реги нужны именно под задачи, но если толком разобраться - тоже не нужны, ибо надо менять условия задачи, чтобы таких дебильных задач не возникало.

Чсв откуда берется? Из екзеля. А екзель откуда береся? От отсутствия акцесса, а отсутствие акцесса откуда? Оттуда что ниасилили. Следовательно видите как далека ретроспектива проблематики. Но решать ее все равно придется. Или что, до морковкиного заговения будем регами парсить екзели?

tysonfury2015 22.07.2015 15:35

Цитата:

Сообщение от kostyanet
Из екзеля. А екзель откуда береся? От отсутствия акцесса, а отсутствие акцесса откуда? Оттуда что ниасилили.

Ты секретаршей по-совместительству работаешь?

kostyanet 22.07.2015 15:36

Кстати, при чем тут сервер вообще? На VBA екзеля и разбирайте эту колонку.

kostyanet 22.07.2015 15:37

Цитата:

Сообщение от tysonfury2015
Ты секретаршей по-совместительству работаешь?

Ага, по совместительству.


Часовой пояс GMT +3, время: 03:08.