Главная страница


ru.cgi.perl

 
 - RU.CGI.PERL ------------------------------------------------------------------
 From : Victor Wagner                        2:5020/400     22 Sep 2004  09:28:41
 To : Mikhail Polykovsky
 Subject : Re: Кодировки
 -------------------------------------------------------------------------------- 
 
 Mikhail Polykovsky <glader@company.utk.ru> wrote:
 
  MP> Здравствуйте. Я делаю сайт. Данные и шаблоны лежат в базе. Вопрос в
  MP> следующем: в какой кодировке лучше их хранить? Соображения следующие:
  MP> - говорят, в win больше всяких типографских символов, воообще богаче
  MP> таблица
 
 Есть еще одна засада - один широко распространенный браузер, увидев
 введенный пользователем символ, не вписывающийся в ту кодировку, в
 которой сервер прислал страницу, молча (т.е. не выставив Content-Type:
 ... charset=) посылает на сервер форму в той кодировке, в которой ему
 удобнее.
  
  MP> - скрипты на unix, поэтому комментарии, сообщения об ошибках, логи cvs
  MP> в koi-8 (англ. не предлагать)
 
 Поставь на Unix локаль CP1251 и не мучайся. Unix не Windows -  работает
 с той кодировкой, с какой скажешь. Хоть UTF-8.
  
  MP> - логи ошибок будут сохраняться в базе, поэтому хочется кодировку одну
  MP> везде
 
  MP> Что посоветуете?
 
 Посоветую задуматься о двух вещах (кроме той, что абзацем выше)
 1. Hачиная с версии 5.8 perl прекрасно умеет преобразовывать из одной
 кодировки в другую. Поэтому никто не мешает писать один файл (STDOUT) в
 cp1251, а другой (log) в koi8-r
 
 2. Большинство баз данных прекрасно обрабатывает ситуацию, когда
 кодировка хранения одна, а кодировка клиента - другая. Поэтому можно
 спокойно запускать то, что лазит в базу из командной строки в koi8-r,
 а базу держать в 1251. Кроме тех самых типографских символов все будет
 видно.
 
 И вообще, если ты используешь Content-Transfer-Encoding: x-gzip, разницы
 между UTF-8 русским текстом и текстом в 8-битной кодировке по размеру
 практически нет. А в UTF-8 можно держать текст на любом языке, хоть на
 китайском.  Правда, у PostgreSQL 7.x были некоторые засады с юникодными
 базами. Hе смотрел, исправлено ли это в 8.0.
  MP> -- 
  MP> Михаил Полыковский
  MP> http://copi.ru/27690/
  MP> Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru
 
 -- 
 Tagline supply exhausted.
 --- ifmail v.2.15dev5.3
  * Origin: Free Net of Leninsky,45 (2:5020/400)
 
 

Вернуться к списку тем, сортированных по:

 Тема:    Автор:    Дата:  
 Кодировки   Mikhail Polykovsky   22 Sep 2004 08:23:04 
 Re: Кодировки   Victor Wagner   22 Sep 2004 09:28:41 
Архивное /ru.cgi.perl/15178da4cbfa3.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional