8-битный слой
Множество
текстов, которое можно представлять 8-битным слоем
Перед тем, как давать описание слоя, уточним, какие тексты предполагается
с помощью него представлять. Как уже говорилось, во главу угла ставятся нужды
(пере)издания церковно-славянских текстов грамматики не позднее конца 19 в.
Более точно:
Состав набираемого текста ограничен следующими правилами:
- заглавные буквы в тексте, набранном обычным шрифтом, могут встречаться
только в начале слов; капитализированные тексты должно набирать только капшрифтом,
и только буквами строчного регистра;
- ударения и придыхания могут стоять только над гласными;
- если слово начинается с гласной, над ней могут стоять лишь следующие надстрочники:
придыхание, исо, апостроф; исо, придыхание, апостроф могут стоять только над
начальной гласной слова;
- вария (без придыхания) может быть лишь на последней букве слова (конечно
же, гласной);
- слово не может начинаться с букв ,
, ,
, ,
поэтому над этими гласными не предусмотрены надстрочники, содержащие придыхание.
На самом деле, в богослужебной литературе встречается одно слово на :
("езда",
см. напр. Службу апп. Петру и Павлу, ирмос 4-й песни канона, глас 8), и даже
(Чин
освящения колесницы). Решено, однако, ради этого случая две отдельные лигатуры
не выделять, ибо места для них нет;
- слово не может содержать в середине
или , поэтому над ними
не предусмотрены надстрочники без придыхания;
- наряду с предыдущими пунктами, не могут встретиться следующие комбинации:
. Последнияя комбинация,
правда, под вопросом (быть может, она имеется в начале слова "ижица"),
но пока что для нее не гарантируется корректный кернинг со следующим символом
(кстати, в слове "ижица" он не нужен);
- простые титла недопустимы над следующими буквами: .
Над символами
простые титла допускаются, но лишь как предельный случай. Для них и только
для них вводится еще один специальный составной надстрочник: приподнятое .
Понимаю, это несколько противоречит общей идеологии об инвариантности "красоты"
положения надстрочников относительно смены гарнитуры, но эти буквы под титлами
встречаются лишь в записи больших чисел, обычно в годах;
- где будут допустимы букво-титла, опишу позднее. Понятно, что там, где они
встречаются в "обычных" не слишком старых ЦС-текстах;
- для
с надстрочником необходимо использовать символ "i без точек" .
Кодировочная
таблица 8-битного слоя
Согласно определению 8-битного слоя, нам достаточно перечислить
224 символа, которые его составляют.
Надстрочник с подчеркиванием внизу означает то, что этот знак
предназначен для заглавных букв. Подчеркнутое дважды простое титло -- "приподнятое
титло" для символов .
Таблица лигатур и букво-титл, внесенных в 8-битный слой:
По какому принципу заполнялся слой.
Слой состоит из символов основных букв, знаков
препинания, символов накладных надстрочников и лигатур.
Основные символы заполнялись так:
- русские буквы (кроме Ээ) были заполнены церковно-славянскими аналогами;
если русская буква имела несколько аналогов, выбирался наиболее часто встречающийся.
Здесь, однако, учитывался следующий ниже пункт;
- заполнялась оставшаяся часть пересечения 1251 с юникодным диапазоном церковно-славянских
символов. Это касается Ii украинских, Ss славянских и "є" украинской;
"Є" украинская оставлена пока свободной. Не решено еще, нужен ли
заглавный регистр для ;
- оставшиеся основные символы размещались на латинице, по принципу графической
схожести. На букву "Ээ" помещена .
Накладные надстрочники строчного регистра размещались на цифрах,
заглавного -- на знаках препинания, не имеющих церковно-славянских аналогов.
Церковно-славянские знаки препинания по возможности размещались
на своих латинских аналогах. При коллизии с размещением составных надстрочников
знаки препинания имели приоритет.
Букво-титла частого применения (,
, ,
, )
помещены по возможности на латинских аналогах, более редкие букво-титла -- на
знаках препинания.
Лигатуры
8-битного слоя
Набор необходимых лигатур формировался исходя из следующих принципов:
- Пара "буква"+"накладной надстрочник" может потенциально
плохо выглядеть; пример -- .
- Пара "буква"+"накладной надстрочник" выглядит неплохо,
но надстрочник может вызвать коллизию с рисунком следующей или предыдцщей
буквы; пример -- .
- Пара "буква"+"накладной надстрочник" выглядит неплохо,
но может потребоваться кернинг в паре ["буква" - "некоторая
следующая буква"]; пример -- .
- Пара "буква"+"накладной надстрочник" выглядят нормально,
и кернинга не требуется, но при переводе буквы в заглавный регистр (в капшрифте)
пара будет выглядеть плохо. Пример - .
- В лигатурный набор добавляются только те лигатуры, которые реально могут
встретиться в текстах, набранных по правилам, указанным веше. Учитывается
то, что обычный текст набирается обычным шрифтом (следовательно, заглавные
буквы могут быть только в начале слов), а капитализированный текст -- капшрифтом,
буквами строчного регистра.
- К сожалению, в 8-битном слое у нас нет возможности снабдить каждую лигатуру
регистровой парой. Поэтому заглавный регистр к существующей строчной лигатуре
добавляется только при необходимости такой лигатуры. А вот существующие заглавные
лигатуры дополняются строчными всегда, ради капшрифтов (согласно четвертому
правилу этого списка).
Размещались лигатуры на оставшихся позициях. По возможности для
наиболее часто встречающихся лигатур подыскивались похожие по начертанию латинские
или национальные символы ("правило благообразной изнанки"). Если среди
лигатур имелись регистровые пары, они размещались на реальных регистровых парах
1251.