|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Valentin Nechayev 2:5020/400 22 Jun 2002 18:48:58 To : "Eugene B. Berdnikov" Subject : Re: iconv -------------------------------------------------------------------------------- >>> Eugene B. Berdnikov wrote: KK>> Как сделать, что бы при перекодировании файла сабж не вылетел на некоторых KK>> символах, а просто игнорировал их? EBB> Потратить несколько часов на то, чтобы пропатчить эту утилиту. :) EBB> Этим Вы сможете заработать себе достаточную известность, чтобы быть EBB> принятым на работу в ice.ru - разумеется, после того, как ответите EBB> на каверзные вопросы техдиректора типа "а что Вы делаете с EBB> неперекодируемыми символами?" или "как определяется, где кончается EBB> неперекодируемый мусор и начинаются новые многобайтовые EBB> последовательности?" :))) Во блин. Hеужели все так ужасно? ;)) Для некоторых кодировок (например, стандартных восьмибиток типа koi8-r или iso-8859-1) определение новых последовательностей тривиально - в приведенном примере, все последовательности состоят из одного символа. Еще есть кодировка, явно сконструированная для того, чтобы в ней неизвестные многобайтные последовательности можно было спокойно херить - называется она, как Вам ни будет странно, utf-8. Что делать с неперекодируемыми символами? - например, заменять на указанный в командной строке символ (а по умолчанию - '?'). И если бы интерфейс iconv был изначально спроектирован не через глубокую @опу, то это бы проблемой не было. Могу послать, кстати, к Win32 API - там это сделано нормально. А еще посмотрите как с iconv'ом в этих вопросах разбирается mutt. Как-то он умудряется аккуратно пропускать символы, непереводимые в локальную кодировку, isn't it? Hе такая уж это сложность ;) P.S. Я как-то действительно патчил какого-то родственника iconv на это и не только. Результаты никуда не выкладывал - сочтено бесперспективным. Hет, в ice.ru не собираюсь - если тамошний staff определяет такую простую вещь как критерий пригодности для их работы, а вместо чтобы подумать - как Вагнер, строит глубокомысленные рассуждения на неизвестные ему тему в трепологической курилке имени ru.linux, то мне там вряд ли будет интересно... /netch желчный. пора сбор #2 пить. --- ifmail v.2.15dev5 * Origin: Dark side of coredump (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/73685a2f4aa3.html, оценка из 5, голосов 10
|