Emacs для начинающих


Codeeqv - часть 2


/p>


Примечания.

1) Все числовые значения кодов шестнадцатеричные.

2) Если в данной кодировке точное соответствие символа отсутствует, а приводится похожий символ, то его код отмечается звездочкой (*) и приводится сам заменяющий символ. Для DOS/Windows кодировок по возможности указываются стандартные для Windows соответствия, определяемые файлом xlat866.bin, однако в 32-битных программах Windows’95 этот файл не используется и соответствия отчасти другие (указываемые через союз or).

Впрочем, от некоторых отступлений, учитывая реальное отсутствие нормативности, я все равно не удержался.

3) Вопросительным знаком отмечены соответствия, сомнительные в отношении их стандартности.

4) Имена символов в Unicode в стандарте написаны полностью большими буквами. В большинстве из них содержится убранное мной определение CYRILLIC, в то же время для специфически сербских букв мной добавлено определение Serbian.

5) Псевдографические символы последней части таблицы содержатся в кодировке ГОСТ (“основной”), но не содержатся в ISO-8859-5, в свою очередь буквы нерусских славянских языков содержатся кодировке ISO-8859-5, но не содержатся в кодировке ГОСТ.

(Исправлены опечатки версии 03-Ноя-97.)

6) Указанные 2 значения UNICODE для двух “буллетов” связаны с фактической эквивалентностью middot и bullet operator (U+00B7

и U+2219), представляющих собой маленькую точку в центре позиции буквы, и с неоднозначностью трактовки и перекодировки “толстой точки” с кодом F9 в CP866. По смыслу это должен быть “буллет” (U+2022), но в определении KOI8-R в RFC-1489 стоит U+2219

(“маленькая точка").

7) Unicode Names не совпадают с Postscript Names, содержащимися в шрифтах TrueType. Postscript Names русских букв имеют вид “afii10xx”.


21-Mar-98 Костя Каз. (kazarn@glas.apc.org)





- Начало -  - Назад -  - Вперед -