Javascript.RU

Создать новую тему Ответ
 
Опции темы Искать в теме
  #11 (permalink)  
Старый 08.11.2010, 09:31
Новичок на форуме
Отправить личное сообщение для Kolyaj Посмотреть профиль Найти все сообщения от Kolyaj
 
Регистрация: 19.02.2008
Сообщений: 9,177

Строки в файлах на диске тоже хранятся в виде байтов. Для этого и придумали кодировки. Вы сейчас, возможно сами того не ведая, придумали себе свою собственную кодировку. Если вам эти байты отдавать потом куда-то другим программам, то я бы лучше сделал перекодировку в UTF-8, её описание есть на той же википедии.

Я в подобной задаче использовал похожую на UTF кодировку, но чуть проще. Двоичное представление числа делится на отрезки по 7 бит, начиная справа. Каждый отрезок становится байтом. Далее каждому байту старший разряд устанавливается в 1, кроме последнего, у которого будет 0.
При раскодировке смотрим первый бит очередного байта, если он равен 1, то число ещё не кончилось, надо смотреть следующий байт. Когда все нужные байты собраны, отбрасываем у них старшие биты и собираем число.
Ответить с цитированием
  #12 (permalink)  
Старый 08.11.2010, 09:51
Профессор
Отправить личное сообщение для tenshi Посмотреть профиль Найти все сообщения от tenshi
 
Регистрация: 20.03.2008
Сообщений: 1,183

в ютф8 разве не так же? о0
__________________
.ня
Ответить с цитированием
  #13 (permalink)  
Старый 08.11.2010, 09:53
Новичок на форуме
Отправить личное сообщение для Kolyaj Посмотреть профиль Найти все сообщения от Kolyaj
 
Регистрация: 19.02.2008
Сообщений: 9,177

Не, там метки малость другие. http://ru.wikipedia.org/wiki/UTF-8
Ответить с цитированием
  #14 (permalink)  
Старый 08.11.2010, 09:58
Профессор
Отправить личное сообщение для tenshi Посмотреть профиль Найти все сообщения от tenshi
 
Регистрация: 20.03.2008
Сообщений: 1,183

"в формате UTF-8 символы латинского алфавита, знаки препинания и управляющие символы ASCII записываются кодами US-ASCII, a все остальные символы кодируются при помощи нескольких октетов со старшим битом 1. "
__________________
.ня
Ответить с цитированием
  #15 (permalink)  
Старый 08.11.2010, 10:00
Новичок на форуме
Отправить личное сообщение для Kolyaj Посмотреть профиль Найти все сообщения от Kolyaj
 
Регистрация: 19.02.2008
Сообщений: 9,177

В UTF все октеты имеют старший бит 1, а у меня все, кроме последнего.
Ответить с цитированием
  #16 (permalink)  
Старый 08.11.2010, 10:00
Профессор
Отправить личное сообщение для tenshi Посмотреть профиль Найти все сообщения от tenshi
 
Регистрация: 20.03.2008
Сообщений: 1,183

а, просёк, там используется лишний бит для разделения юникода от аски
__________________
.ня
Ответить с цитированием
Ответ



Опции темы Искать в теме
Искать в теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Как создать многомерный массив FRIE Общие вопросы Javascript 29 02.06.2010 19:14
Подскажите, как вернуть js-скрипт массив Polkan AJAX и COMET 18 30.04.2010 23:30
Как передать массив данных на сервер DVVID Общие вопросы Javascript 7 08.04.2010 12:11
Как сделать чтобы text() брал только текст родителя без текста вложенных контейнеров? Andrey32 jQuery 3 23.05.2009 01:33
Как лучше сделать глобальный массив skyfish AJAX и COMET 4 17.02.2009 18:05