|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Konstantin Tokar 2:5020/400 15 Feb 2001 12:54:38 To : All Subject : Re: кодировки, подождем твою мать --------------------------------------------------------------------------------
> > Очень медленно по словарю. Проще частотный анализ двухбуквенных
> > сочетаний.
>
> а попопдробнее?
Берёшь большой массив текстов в определеннной кодировке, строишь N
массивов 256х256, в который заносишь количество буквосочетаний в N
кодировках, с учетом или без строчных/прописных букв, сравниваешь
массивы и строишь массив, в котором элемент [x][y] имеет код кодировки,
в которой чаще всего встречается сочетани xy. Вот и все, на Перле не
очень быстро, а на C очень.
--
Konstantin Tokar (http://www.mpei.ac.ru/tokar)
--- ifmail v.2.15dev5
* Origin: Demos online service (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/12770f080f142.html, оценка из 5, голосов 10
|