Различить фамилию от Имени
Откройте какое-нибудь письмо в почте и обратите внимание на поле от кого, там может быть Фамилия + Имя || Имя + Фамилия. Мне нужно брать строку из поля от кого и определятьчто здесь является именем а что фамилией... Задача не из легких, думаю по морфологии определять (окончания) но это не совсем точно... если есть какие-либо варианты отпишите пожалуйста
|
Цитата:
|
Строка может быть как и на русском так и на английском так и транслитом...
от: Ивана Солнцева от: Ivana Solnceva от: John Smith |
Rise,
да хорошая идея, я как раз этим щас и занимаюсь проблема в том что не могу отличить транслит от анг слов |
Rise,
нет, например есть имя Mikel, в базе оно как Майкл, а транслит будет majkl |
Rise,
Думаю использовать яндекс переводчик его API, там переводить а далее искать в базе... и забить на транслит можно |
Цитата:
- Ваша фамилия? - Гуцишан. - Через черточку? И это реальная ситуация, которой парнишку просто задолбили. ) А если еще и на английском, да написано некорректно... DynkanMaclaud, письма чьи, отправляет/получает кто? |
laimas,
у нас своя почта самописная, а отправляет кто угодно , @mail, @gmail, @myjob |
Цитата:
А с других серверов почтовых парсить, но ведь не факт, что в поле от кого вообще будет ФИО. |
DynkanMaclaud,
У меня на яндексе стоит имя фамилия 1 2. Есть очень сложные для понимания имена, например, Нурмухамед Боранбай (это реальное имя фамилия, а если быть точным, то фамилия имя) Ну или более понятная для нас "Черепаха Алла" тоже очень сложна для определения программой А если имя будет Джон Смит(это вы в примере не указали)? Так что как указали выше, только база имён, только хардкор и молиться, что бы не попалась какая нить Иван Наталья или Бауыржан Момышулы. Может стоит описать что за система, как работает и что за письма-будет больше ясности |
Часовой пояс GMT +3, время: 09:21. |