Вход

Просмотр полной версии : Кодировка и ее свойства


Eugene
15.02.2010, 22:53
Народ, у кого были проблемы с кодировкой и как вы их героически решали. Может кто подскажет какие лучше всего кодировки использовать.
Вообщем, кто хочет, делитесь инфой по теме.:dance:

B@rmaley.e><e
15.02.2010, 23:09
Использовать везде юникод и не напрягаться.

Kolyaj
16.02.2010, 10:26
Юникод не кодировка, а таблица символов. UTF-8 -- одна из кодировок юникода.

Eugene
16.02.2010, 16:24
а как же в юникоде писать русские буквы??????

Kolyaj
16.02.2010, 16:31
А в чём проблема?

e1f
16.02.2010, 16:32
а как же в юникоде писать русские буквы??????

Все просто. Верхняя половина буквы -- первый байт, нижняя второй :)

Kolyaj
16.02.2010, 16:36
Все просто. Верхняя половина буквы -- первый байт, нижняя второй
Кроме буквы Ы, там не верняя и нижняя половины, а правая и левая.

Поэтому, кстати, китайские иероглифы занимают по 3-4 байта -- они крупнее наших букв.

e1f
16.02.2010, 18:01
Не то чтобы крупнее, там надо на больше частей разбивать :)

Ex_Soft
17.02.2010, 13:28
там надо на больше частей разбивать
Боюсь
3-4 байта
не хватит (http://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%82%D0%B0%D0%B9%D1%81%D0%BA%D0%BE%D 0%B5_%D0%BF%D0%B8%D1%81%D1%8C%D0%BC%D0%BE#.D0.98.D 0.B5.D1.80.D0.BE.D0.B3.D0.BB.D0.B8.D1.84.D1.8B_.D1 .81_.D1.81.D0.B0.D0.BC.D1.8B.D0.BC_.D0.BC.D0.B0.D0 .BB.D1.8B.D0.BC_.D0.B8_.D0.B1.D0.BE.D0.BB.D1.8C.D1 .88.D0.B8.D0.BC_.D0.BA.D0.BE.D0.BB.D0.B8.D1.87.D0. B5.D1.81.D1.82.D0.B2.D0.BE.D0.BC_.D1.87.D0.B5.D1.8 0.D1.82) ;)

Eugene
22.02.2010, 14:48
Народ, скачал страничку с нерусифицированным шаблоном, как ни меняю кодировку в charset="" работает только utf-8

Gvozd
22.02.2010, 16:24
как ни меняю кодировку в charset="" работает только utf-8
разумется
charset указывает на то в какой кодировке текст в документе
если текст в документе все эти правки у вас был сохранен в UTF-8, то и charset должен быть соответсвующий
нерусифицированным шаблоном
такого не бывает.глупость

Eugene
25.02.2010, 22:28
что значит подходящий charset, его тоже можно поменять???

Gvozd
25.02.2010, 23:51
*WALL*
текстовый документ может быт сохранен в одной из множества кодировок
charset должен указывать в точности в какой кодировке был сохранен документ
если документ будет сохранен в одной кодировке, а charset будет указывать, что он якобы сохранен в другой кодировке, то документ отобразится неправильно
в идеале сервер также должен при отправке документа также указывать верную кодировку в header-ах документа
в идеале кодировка, и соответсвующий charset-ы должны быть-UTF-8