|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Dmitry E. Oboukhov 2:5020/830.100 21 Mar 2007 02:01:19 To : All Subject : задачка -------------------------------------------------------------------------------- надо выделить из текста все имена собственные. соответственно два вопроса эхотажный и офтопик офтопик: никому не встречался словарь имен собственных разделенный желательно на мужчин и женщин? вопрос: а кто что может сказать относительно алгоритма если без словаря? тексты на входе - случайные истории пишущиеся разными людьми, потому составить бы такой алгоритм чтобы вытаскивал имена но по возможности без большого уровня шума. если в лоб то слово в предложении написанное с большой буквы считаем именем а дальше если улучшать этот алгоритм кто что предложит? ... Гуманизм породил геноцид --- Mutt/1.5.13 (2006-08-11) * Origin: Debian GNU Linux (2:5020/830.100) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/4461f646d97b.html, оценка из 5, голосов 10
|