ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 

  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА














     АРХИВ :: Apache-Talk
Apache-Talk mailing list archive (apache-talk@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [apache-talk] encoding URL: localized version needed (fwd)



In <03fa01bed409$7d13db00$cd0d11ac@host205.spb.in.rosprin.ru> Alexander Voropay 
(a.voropay@globalone.ru) wrote:

>>>>Беда в том, что она эскейпит все русские буквы, посему перестает работать
>>>>перекодировка (при посылке параметров к скрипту, например).
>>AV>  В принципе по новым стандартам все не-Latin-1 символы в URL
>>AV> должны кодироваться в UNICODE.
>>
>>Это по каким-таким "новым стандартам" ? RFC, please.

AV> http://www.w3.org/International/

AV> 4. URIs & other identifiers including non-ASCII characters

Из СТАНДАРТОВ я нашел там только RFC 2396 ... В котором ничего про UNICODE
не говорится. Все остальное -- draft'ы (=вилами по воде) или стандарты, не
имеющие отношения к HTTP ...

>>AV>  Собственно, MS IE 5.0 так и делает.
>>
>>Гм. Неужели этот монстр хоть что-нибудь делает в соответствии
>> со стандартами, а не вопреки им ?

AV>  Ну, от комментариев на тему моральной позиции, мотивов
AV> поведения, рыночной доли и т.д. фирмы MS я воздержусь... :)

При чем тут рыночная доля ?

AV>  Что касается технологии -- да, я утверждаю что Microsoft Internet
AV> Explorer 4 и 5 вполне точно соответствуют стандартам от W3C.
AV> Если вы знаете _явное_ несоответствие, хотелось бы услышать.

Легко. История всегда одна и та же: Microsoft решает, что существующие
стандарты никуда не годятся и "улучшает" их никому ничего не говоря. Собственно
ровно это произошло с Java'ой, после чего Sun взбесился и в суд подал.
А IETF смотрит на это сквозь пальцы, да и с точки зрения юриспридунции
не ясно -- может ли кто-нибудь судить Microsoft за нарушения в реализации
MIME, HTTP, SSL и т.п.  Разве что общество потребителей за недобросовестную
рекламу...

Примеры:

MIME, RFC 2045, 6.7.  Quoted-Printable Content-Transfer-Encoding
-- cut --
    (4)   (Line Breaks) A line break in a text body, represented
          as a CRLF sequence in the text canonical form, must be
          represented by a (RFC 822) line break, which is also a
          CRLF sequence, in the Quoted-Printable encoding.  Since
          the canonical representation of media types other than
          text do not generally include the representation of
          line breaks as CRLF sequences, no hard line breaks
          (i.e. line breaks that are intended to be meaningful
          and to be displayed to the user) can occur in the
          quoted-printable encoding of such types.  Sequences
          like "=0D", "=0A", "=0A=0D" and "=0D=0A" will routinely
          appear in non-text data represented in quoted-
          printable, of course.
-- cut --
Пошлите письмо из Otlook'а или Outlook Express'а и при'attach'те к нему .rc
файл. Это $^%%&*^* приклеит к нему Content-Type: application/octet-stream и
оформит все как text/plain в Quoted-Printable (то есть с теми самымы ЯВНО
ЗАПРЕЩЕННЫМИ "hard line breaks").

HTTP, RFC 2068, 7.2.1 Type
-- cut --
When an entity-body is included with a message, the data type of that
body is determined via the header fields Content-Type and Content-
Encoding. These define a two-layer, ordered encoding model:

       entity-body := Content-Encoding( Content-Type( data ) )

Content-Type specifies the media type of the underlying data.
Content-Encoding may be used to indicate any additional content
codings applied to the data, usually for the purpose of data
compression, that are a property of the requested resource. There is
no default encoding.

Any HTTP/1.1 message containing an entity-body SHOULD include a
Content-Type header field defining the media type of that body. If
and only if the media type is not given by a Content-Type field, the
recipient MAY attempt to guess the media type via inspection of its
content and/or the name extension(s) of the URL used to identify the
resource. If the media type remains unknown, the recipient SHOULD
treat it as type "application/octet-stream".
-- cut --
Теперь попробуйте положить на web-server текстовый файл README.DOC и добимться
от MS IE того, чтобы он этот text/plain (ЯВНО УКАЗЫННЫЙ text/plain) показал
как text/plain (а не в WordPad'е и не в WinWord'е :-)

И все остальное в том же духе: HTML и XML, CSS и SSL, и т.д. и т.п. Практически
нет ни одного сколько-нибудь значимого стандарта, который бы MS IE не нарушал.
Я могу понять и простить случайные ошибки, но когда стандарты нарушаются
сознательно... Извините -- я в такие игры не играю. "You can use MS IE at your
will but please do not send me ANY bug-reports if you are using it".



=============================================================================
=               Apache-Talk@lists.lexa.ru mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =



 




Copyright © Lexa Software, 1996-2009.