ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 

  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА














     АРХИВ :: Apache-Talk
Apache-Talk mailing list archive (apache-talk@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [apache-talk] meta charset problems



On Mon, 13 Sep 1999, Alexander Voropay wrote:

> >> >> Кстати, такая ситуация IMHO близка к случаю документа на нескольких
> >> >> языках - сначала кусок на русском, потом на польском, потом на
> >> >> турецком.
> 
> >>
> >> Т.е. Апачу надо сказать, что это документ в UTF-8? А внутри-то как языки
> >> разделять? Как в HTML 4.0 предписано?
> >
> >Зачем? Как предписано в utf-8. Его прелесть как раз в том, что ничего там
> >разделять не надо, места в кодировке хватает всем.
> 
> 
>  Видите ли... Например символ 'CYRILLC CAPITAL LETTER A' который
> U+0410, может встречаться в тексте на русском <P LANG="ru">,
> украинском <P LANG="uk">, белорусском <P LANG="by"> и еще на
> целом ряде языков. А обработка, поиск и т.д. может существенно
> отличаться. И для HTML и для XML.

Так там речь по сути о кодировках идёт. О том, что буквы из всех этих
языков в 8-битную кодовую таблицу не влезают. А параметр LANG - для
парсера, а не для httpd. Даже что-либо перекодирующего.

-- 
Artem Chuprina                             E-mail: ran@pirit.com
Network Administrator                        FIDO: 2:5020/371.32
PIRIT Corp.                              Phone: +7(095) 115-7101

=============================================================================
=               Apache-Talk@lists.lexa.ru mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =



 




Copyright © Lexa Software, 1996-2009.