|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Vasily Shmelev 2:5020/400 16 Jul 2001 23:22:15 To : PA Subject : Re: Однозначное определение кодировки? --------------------------------------------------------------------------------
Hello! PA wrote in message:
P> А как однозначно определить текст в KOI8 или
P> Win кодировке? Символы лежат в одном диапазоне:
P> 192-255.
Ммм... Hу, я думаю, что для не очень маленьких текстов можно попробовать
так (пришло в голову): в русских текстах наиболее часто встречается буква
"а" или "о". Таким образом, подсчитываем число буковок, берем самую
используемую и сравниваем с эталоном. А уж кодировку определить так не
проблема.
--
С уважением,
Василий
...умная и красивая -- это страшно
--- ifmail v.2.15dev5
* Origin: йПЮЯМHОHОЕПЕВМШЕ ОHОСЦЮИВХЙХ (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/9104679a1281.html, оценка из 5, голосов 10
|