Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Pavel V. Ammosov                     2:5020/52      02 Feb 2001  02:06:20
 To : Serge Shikov
 Subject : Re: кодировки,   подождем твою мать
 -------------------------------------------------------------------------------- 
 
 >Ruslan Bondarev wrote:
 >> 
 >>     Может это прозвучит странно, но мне хотелось бы узнать как цивилизованные
 >> люди программно распознают кодировку. Методом частотного анализа, чтоль? (о:
 >Hу да. Можно конечно и по словарю слова проверять, кто-то даже помнится
 >утверждал, что получил неплохие результаты этим способом...
 
 Если надо в частном случае разделить koi8-r и windows-1251, то 
 Lingua::DetectCharset с CPAN выдает очень хорошие результаты:
 perl -MLingua::DetectCharset \
 -e 'print Lingua::DetectCharset::Detect("бHОПHЯ")'
 WIN
 К сожалению, cp866 и кодировки маков он не распознает.
 -- 
 Pavel Ammosov                                               O    \
 apavel@aha.ru                                                 __  )
 http://isabase.philol.msu.ru/~apavel/                             )
 wget -O - isabase.philol.msu.ru/~apavel/key.asc|pgp -fka    O    /
 --- slrn/0.9.6.3 (Linux)
  * Origin: Mr. Postman (2:5020/52.0)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: кодировки, подождем твою мать   Pavel V. Ammosov   02 Feb 2001 02:06:20 
Архивное /ru.perl/83592294a98f0.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional