Работа в системе LaTeX



         

Понятие кодировки. Пример: кодировка T1.


Система LaTeX пытается реализовать следующую простую идею: набор символов и форма символов (гарнитура) являются независимыми координатами. Скажем, можно говорить о русских и латинских шрифтах (два значения первой координаты), а также о шрифтах гарнитуры таймс и гельветика (два значения второй координаты), и двигаться по каждой координате независимо.

Несмотря на кажущуюся очевидность, этот принцип трудно реализовать буквально, и не только потому, что какие-то значения координат соответствуют отсутствующим в данном комплекте шрифтам, но и по более тонким причинам. Например, в какой-то гарнитуре может быть специальный символ { "fi"}, которым изображаются стоящие рядом буквы f и i (это называется " лигатурой", обратите внимание на отличие этого символа от набранных подряд букв:fi), а в другой гарнитуре соединять эти буквы не принято и такого символа нет.

Тем не менее в первом приближении можно считать, что в системе LaTeX есть два независимых параметра: кодировка (encoding) говорит, какие символы имеются, а семейство (font family) определяет внешний вид символов. Мы уже упоминали кодировку T1, используемую при работе с неанглийскими языками на латинской основе. Рисунок B.1 показывает символы кодировки T1, представленные шрифтами семейства Computer Modern.

Кодировка T1

Рис. B.1.  Кодировка T1

Та же самая кодировка T1, представленная шрифтами семейства Helvetica, показана на рисунке B.2

Кодировка Т1:Helvetica

Рис. B.2.  Кодировка Т1:Helvetica

В теории эти две таблицы должны отличаться лишь формой символов, но на практике это не совсем так: в нынешней версии LaTeX'а некоторые позиции в кодировке T1 в шрифте типа Helvetica не заполнены соответствующими буквами.

Тем не менее кодировка T1 (ее еще называют Cork encoding, поскольку кодировка была утверждена на конференции TeXников в ирландском городе Корк) обеспечивает более или менее приемлемую основу для использования LaTeX'а с разными шрифтами и разными языками с латинской графикой.

Впрочем, до сих пор по умолчанию используется так называемая кодировка OT1, в которой всего

128
символов, представленных в оригинальных шрифтах Кнута.


Содержание  Назад  Вперед