|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Pavel V. Ammosov 2:5020/52 02 Feb 2001 02:06:20 To : Serge Shikov Subject : Re: кодировки, подождем твою мать --------------------------------------------------------------------------------
>Ruslan Bondarev wrote:
>>
>> Может это прозвучит странно, но мне хотелось бы узнать как цивилизованные
>> люди программно распознают кодировку. Методом частотного анализа, чтоль? (о:
>Hу да. Можно конечно и по словарю слова проверять, кто-то даже помнится
>утверждал, что получил неплохие результаты этим способом...
Если надо в частном случае разделить koi8-r и windows-1251, то
Lingua::DetectCharset с CPAN выдает очень хорошие результаты:
perl -MLingua::DetectCharset \
-e 'print Lingua::DetectCharset::Detect("бHОПHЯ")'
WIN
К сожалению, cp866 и кодировки маков он не распознает.
--
Pavel Ammosov O \
apavel@aha.ru __ )
http://isabase.philol.msu.ru/~apavel/ )
wget -O - isabase.philol.msu.ru/~apavel/key.asc|pgp -fka O /
--- slrn/0.9.6.3 (Linux)
* Origin: Mr. Postman (2:5020/52.0)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/83592294a98f0.html, оценка из 5, голосов 10
|