logo
AOM / Мельник А

2.6.4.4. Стандарт кодування символів Unicode

Коди EBCDIC та ASCII забезпечили кодування букв латинського алфавіту. З ме­тою забезпечення кодування букв інших алфавітів та підтримки мов народів світу в 1991 році було запропоновано код під назвою Unicode.

77

Unicode - це 16-розрядний алфавіт, сумісний з ASCII та погоджений з міжнародним алфавітом ISO/IEC 10646-1. Оскільки 16-ма розрядами можна закодувати 64К символів, цього достатньо для кодування всіх букв алфавітів народів світу.

Кодовий простір коду Unicodeвміщує 5 частин, як це показано в табл. 2.14.

Таблиця 2.14

Тип символу

Опис набору символів

Кількість символів

Шістнадцяткові значення символів

Алфавіти

Латинський, кирилиця, грецький і т.д.

8192

Від 0000 до 1FFF

Символи

Графічні мітки, математичні символи і т.д.

4096

Від 2000 до 2FFF

CJK

Китайські, японські і корейські фонетичні символи і пунктуації

4096

Від 3000 дo3FFF

Han

Уніфіковані китайські, японські і корейські

40960

Від 4000 до DFFF

Розширення чи надлишок від Han

4096

Від Е000 до EFFF

Вказані користувачем

4096

Від F000 до FFFF