Главная страница


ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Vasily Shmelev                       2:5020/400     16 Jul 2001  23:22:15
 To : PA
 Subject : Re: Однозначное определение кодировки?
 -------------------------------------------------------------------------------- 
 
 Hello! PA wrote in message:
 
 P> А как однозначно определить текст в KOI8 или
 P> Win кодировке? Символы лежат в одном диапазоне:
 P> 192-255.
 
     Ммм... Hу, я думаю, что для не очень маленьких текстов можно попробовать
 так (пришло в голову): в русских текстах наиболее часто встречается буква
 "а" или "о". Таким образом, подсчитываем число буковок, берем самую
 используемую и сравниваем с эталоном. А уж кодировку определить так не
 проблема.
 
 --
 С уважением,
          Василий
 
 ...умная и красивая -- это страшно
 
 --- ifmail v.2.15dev5
  * Origin: йПЮЯМHОHОЕПЕВМШЕ ОHОСЦЮИВХЙХ (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Однозначное определение кодировки?   PA   16 Jul 2001 19:09:08 
 Re: Однозначное определение кодировки?   Vasily Shmelev   16 Jul 2001 23:22:15 
 Однозначное определение кодировки?   Sasha Breger   17 Jul 2001 17:59:37 
 Однозначное определение кодировки?   Sergey Andrianov   09 Aug 2001 21:52:29 
Архивное /ru.algorithms/9104679a1281.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional