Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Dmitry E. Oboukhov                   2:5020/830.100 21 Mar 2007  02:01:19
 To : All
 Subject : задачка
 -------------------------------------------------------------------------------- 
 
 надо выделить из текста все имена собственные.
 
 соответственно два вопроса эхотажный и офтопик
 
 офтопик: никому не встречался словарь имен собственных разделенный
 желательно на мужчин и женщин?
 
 вопрос: а кто что может сказать относительно алгоритма если без словаря?
 
 тексты на входе - случайные истории пишущиеся разными людьми, потому
 составить бы такой алгоритм чтобы вытаскивал имена но по возможности без
 большого уровня шума.
 
 если в лоб то слово в предложении написанное с большой буквы считаем
 именем
 
 а дальше если улучшать этот алгоритм кто что предложит?
 
 ... Гуманизм породил геноцид
 --- Mutt/1.5.13 (2006-08-11)
  * Origin: Debian GNU Linux (2:5020/830.100)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 задачка   Dmitry E. Oboukhov   21 Mar 2007 02:01:19 
 Re: задачка   Eugene Grosbein   21 Mar 2007 11:37:11 
 задачка   Dmitry E. Oboukhov   21 Mar 2007 11:31:21 
 Re: задачка   Maxim Yemelyanov   21 Mar 2007 17:12:10 
 задачка   Dmitry E. Oboukhov   21 Mar 2007 17:52:54 
Архивное /ru.perl/4461f646d97b.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional