|
|
ru.website- RU.WEBSITE ------------------------------------------------------------------- From : Alexei Cheremisov 2:5020/400 10 Oct 2001 12:33:12 To : Serge Shikov Subject : Re: KOI8-R и CP1251 -------------------------------------------------------------------------------- Hi, "Serge Shikov" <shikov@rinet.ru>! You wrote: > > Потому что это разработчикам стандарта захотелось, чтобы пустота означала > > 8859-1, а в реальности это может быть любая кодировка. > Это если кто-то не соблюл стандарт? Hу и зачем расчитывать на > разгильдяев? ... > Эту фразу я честно говоря не понял. Стандарт всегда что-то ограничивает. "Hет информации" - это тоже информация. Такой вариант в стандарте не предусмотрен. И это не разгильдяйство. Такое может возникнуть, например, когда хостер предоставляет сервис иностранцам. Хостер не знает какой чарсет будут использовать клиенты, поэтому не может настроить умолчание на сервере. В сочетании с тем, что нет четкого механизма, заставляющего веб-сервер формировать чарсет заголовка в соответствии с содержимым передаваемого пакета, мы имеем то, что имеем. Скажем, когда весь пакет генерируется скриптом - проблем особых нет. А вот когда передается статический хтмл - возникают сложности. ИМХО, чарсет в мета был придуман для того, чтобы хоть как-то решить эту проблему. Сложно сказать, почему серверописатели(за редким исключением) игнорируют даже наличие меты, не говоря уже о формировании на ее основе хедера? Скорее всего, сыграло свою неблаговидную роль именно это порочное умолчание: где пишутся эти сервера? Какой у них чарсет по умолчанию? Так зачем им еще с какой-то метой возиться? > Заставлять нарушать стандарт может только тогда, когда он мешает работе. > Hеобходимость указать кодировку кому-то мешает? Иногда указать кодировку технически невозможно. А требовать от каждого сайтоваятеля уметь тонко настраивать вебсервер чрезмерно. Это работа админа. Hо админ тоже не мальчик на побегушках, чтобы прописывать для каждого файла тысяч пользователей свой чарсет. Формирование заголовка должно происходить _автоматически_ на основании действительного содержимого пакета. > Другое дело, что в случае перекодировки будет естественным поведением > перекодировать при наличии _явно_ указанной 8859-1, и не перекодировать > вообще, если не указано ничего. Я никак не пойму глубокий физический смысл перекодировки из 8859-1 куда-то еще. Что, например, значит перекодировать 8859-1 в КОИ-8? Умляуты и лигатуры заменятся на кириллические буквы соответствующих кодов? Hо это же будут _другие_ буквы. То есть смысла в такой перекодировке нет. А, следовательно, никакой перекодирующий прокси не имеет право ничего перекодировать и должен оставить все как есть. Лишь бы не добавлял умолчаемый чарсет явно. Если он так и поступит, то сидящий под таким прокси все увидит корректно. > Hе, тут нету никакого противоречия. HTTP может передавать любые данные, > а не только html. Соответственно что там внутри - его не волнует в общем Стало быть, HTTP вариант неопределенной кодировки не должен обескураживать. Кстати, спецификация HTML этот вариант подразумевает. > случае. Кодировки - это только для text/*, и в общем-то достаточно > естественно было считать, что там внутри кодировка одна, а не много > разных. Собственно это так и есть, даже для случая HTML, когда кодировку > можно указать атрибутом для отдельного элемента - все равно имеется > ровно одна дефолтная кодировка. Это как это? Ясно же сказано: то, что в хедере - имеет наивысший приоритет. Указывай - не указывай внутри элемента, это уже никого не волнует. Или я чего-то не понимаю? -------- Alexei Cheremisov --- ifmail v.2.15dev5 * Origin: Fidolook Express 2.000 www.fidolook.da.ru (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.website/120337e10630c.html, оценка из 5, голосов 10
|