|
ru.unix- RU.UNIX ---------------------------------------------------------------------- From : Eugene Grosbein 2:5006/1 26 Jun 2007 10:04:54 To : Victor Wagner Subject : Re: автодетект кодировки --------------------------------------------------------------------------------
14 июн 2007, четверг, в 15:58 KRAST, Victor Wagner написал(а):
EG>> Посоветуйте command-line утиль, которую можно будет
EG>> применить в стиле charset=`command $file`, при этом в
EG>> charset окажется windows-1251, koi8-r, utf-8 (или unknown)
EG>> - имена кодировок желательно в стиле iconv. Ограничение -
EG>> крайне желательно на C, не тянуть perl5 с модулями, питон
EG>> etc. Зависимость от iconv поощряется :-)
VW> http://trific.ath.cx/Ftp/enca/
Hу вот и первый косяк:
echo -n "Лог к 45-му" | iconv -f koi8-r -t windows-1251 | \
/usr/local/bin/enca -L ru -r
Пишет "unknown". Если детектить то же в koi8-r или utf-8, определяет верно.
И чего делать?
Eugene
--
For the Colonel's Lady an' Judy O'Grady
Are sisters under their skins!
--- slrn/0.9.8.1 (FreeBSD)
* Origin: Svyaz Service JSC (2:5006/1@fidonet)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix/26093cc4b5cf6.html, оценка из 5, голосов 10
|