|
|
ru.unix- RU.UNIX ---------------------------------------------------------------------- From : Stanislav Latishko <sl@sl.spb.su> 15 Apr 2001 01:03:02 To : Eugene B. Berdnikov Subject : Re: Посоветуйте 2 програмки ... --------------------------------------------------------------------------------
EBB> Тривиально. Достаточно посчитать к-во символов в позициях 0300-0337
EBB> и 0340-0377, и koi8-r надежно отличается от cp1251. А если уж по
EBB> науке частотный анализ сделать, взвешивая каждый байт, то... :-)
А вот обломись :) Hе дождавшишь манны небесной, я сам написал
примитивный частотный анализ. Дык вот, koi надежно отличается _от 866_
при количестве байтов больше 5:). А с отличением koi от 1251 совсем
не так радужно ... Я открыл рот от от изумления, когда моя программа
уверенно сказала '1251' на файло, автор которого, как и я, терпеть не
может виндов. Заглядываю внутрь - koi ... Что за бред ?! Пролистываю
файл ближе к середине - вот оно: бОльшая часть комментариев просто
набрана в верхнем регистре :))) Мда ... Т.е. для _надежного_ ответа
надо переделать алгоритм "принятия решения" - посчитали с учетом
регистра, потом без учета регистра, сравнили 2 пары чисел... Это уже
меня заломало, хотелось закончить быстрей.
--
Stanislav Latishko
sl@sl.spb.su ; 2:5030/949
--- ifmail v.2.14
* Origin: Привет с Большого Бодуна ! (2:5030/949@fidonet)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix/35004a5c920d.html, оценка из 5, голосов 10
|