ahinea.com: О сайте, Техно, Со-общение, Забота о себе, Личное, Прочее.

Вы находитесь в разделе Техно, в Техно-словарь. Назад: XML, W3C, XSL, XSLT и XSL-FO, CSS, Metadata, Topic Maps и XTM, RDF. Вперед: Wiki.

Unicode

Универсальный charset, международный стандарт.

By Иван Курманов <>, Sun, 30 Mar 2003 14:15:00

Так же известен под названием ISO 10646.

База данных по символам и знакам (в том числе буквам и иероглифам) всех основных языков мира. Эта база данных включает для каждого символа/знака:

Кроме этого, о символе может быть известно, что он не используется сам по себе, а только как часть составного сиволам, или только в определенной последовательности с другими символами. И многие другие детали, специфичные для разных систем письменности и разных языков.

UTF-8 и UTF-16

Ядро стандарта Unicode - это набор символов, или character set. Но набор символов - это просто таблица: число -- символ. И текст, с точки зрения Unicode, - это последовательность символов, то есть последовательность чисел.

Для того, что бы использовать набор символов для хранения, обработки или передачи данных по сети еще нужен способ преобразовать последовательность чисел в последовательность байтов. Это называется кодировка, или по-английски: encoding.

UTF-8 и UTF-16 это две кодировки, которые используются для представления Unicode данных.

Я использовал эту статью:

This is Unicode. By Иван Курманов. Sun, 30 Mar 2003 14:15:00. It is part of Техно-словарь, which is part of Техно, which is part of Ahinea.com.

URL: http://ahinea.com/geekdict/unicode.html

По иерархии раздела Техно-словарь, вперед: Wiki, назад: RDF.