Изменить стиль страницы

Приложение E

Описание Base64

Этот алгоритм был разработан для представления произвольных последовательностей байтов в форму, читаемую для человека. Кодирующий и декодирующий алгоритмы очень просты, но закодированные данные примерно на 33% больше, чем некодированные. Этот метод идентичен тому, который используется в приложениях PEM (Privacy Enhanced Mail), описанной в RFC 1421 с одним отличием: base64 не приемлет встроенного «чистого» текста.

Base64 использует 65-символьный поднабор из US-ASCII, выделяя 6 бит на каждый печатный символ. (65-й символ «=» используется для обозначения функции спец. обработки).

Этот поднабор имеет важное свойство: он идентичен всем версиям языковой кодировки ISO 646, включая US ASCII, а также всем версиям EBCDIC. Другие популярные механизмы кодирования (uuencode, base85 — часть уровня 2 PostScript) не разделяют этих свойств и поэтому не удовлетворяют требованиям переносимости для двоичных данных электронной почты.

Процесс кодирования преобразует 3 входных символа в виде 24-битной группы, обрабатывая их слева направо. Эти группы затем рассматриваются как 4 соединенные 6-битные группы, каждая из которых транслируется в одиночный символ алфавита base64. При кодировании base64, входной поток байтов должен быть упорядочен старшими битами вперед.

Каждая 6-битная группа используется как индекс для массива 64-х печатных символов. Символ, на который указывает значение индекса, помещается в выходную строку. Эти символы выбраны так, чтобы быть универсально представимыми и исключают символы, имеющие специальное значение для SMTP-транспорта («.», CR, LF) и для синтаксиса вложенных тел MIME («-»).

 Таблица: Алфавит Base64

Создание электронных книг в формате FictionBook 2.1: практическое руководство bas64tab.png

Выходной поток (закодированные байты) должен иметь длину строк не более 76 символов. Все признаки перевода строки и другие символы, отсутствующие в таблице 1, должны быть проигнорированы декодером base64. Среди данных в Base64 символы, не перечисленные в табл. 1, переводы строки и т.п. должны говорить об ошибке передачи данных, и, соответственно, почтовая программа должна оповестить пользователя о ней.

Если в хвосте потока кодируемых данных осталось меньше, чем 24 бита, справа добавляются нулевые биты до образования целого числа 6-битных групп. А до конца 24-битной группы остается от 0 до 3-х недостающих 6-битных групп, вместо каждой из которых ставится символ-заполнитель «=». Поскольку весь входной поток представляет собой целое число 8-битных групп (т.е., просто байтных значений), то возможны лишь следующие случаи:

(1) входной поток как раз оканчивается 24-битной группой. В таком случае, выходной поток будет оканчиваться четырьмя символами Base64 без символа «=»;

(2) хвост входного потока имеет длину 8 бит. Тогда в конце выходного кода будут два символа Base64, с добавлением двух символов «=»;

(3) хвост входного потока имеет длину 16 бит. Тогда в конце выходного будут стоять три символа Base64 и один символ «=».

Т.к. символ «=» является хвостовым заполнителем, его появление в теле письма может означать только то, что конец данных достигнут. Но такой гарантии нет, если число переданных битов кратно 24.

Любые бессмысленные последовательности в коде Base64 вроде «=====» должны быть игнорированы.

Основано на:

Спецификация RFC 1521 «MIME — Multipurpose Internet Mail Extensions. Part one.»

Перевод: Антон Воронин

Приложение Ж

Описание стандарта ISBN

Международное агентство ISBN присваивает идентификатор группы, который обозначает либо группу стран (например, 0 — для англоязычных стран: Великобритании, США, Австралии, Канады, Ирландии и других), либо отдельную страну (например, 933 — для ШР). Количество цифр в идентификаторе группы зависит от годового объема книжной продукции страны.

Идентификаторы группы устанавливается международным агентством ISBN в следующих диапазонах чисел:

0–7

60–94

950–997

9980–9989

99900–99999

<...>

1. Общие положения

1.1. Международный стандартный номер книги — универсальный идентификационный код, проставляемый на книгах и брошюрах.

1.2. В соответствии с ГОСТ 16447-70 «Издания. Термины и определения основных видов»   книга — непериодическое текстовое издание объемом свыше 48 страниц, брошюра — непериодическое текстовое издание объемом свыше четырех, но не более 48 страниц.

<...>

3. Состав и структура ISBN

3.1. Международный стандартный номер книги состоит из аббревиатуры ISBN (независимо от языка издания книги или брошюры),  и 10 цифр.

3.2. Дня обозначения цифровой части ISBN     применяется арабские цифры от 0 до 9. Последняя цифра    ISBN -   контрольная — может быть римской цифрой X, используемой для обозначения числа 10.

3.3. Цифровая часть ISBN состоит из четырех групп цифр, содержащих различное количество цифровых знаков, отделяемых друг от друга дефисом.

Цифровая часть отделяется от аббревиатуры ISBN пробелом.

3.4. Четыре группы цифр ISBN располагаются в следующей последовательности:

1) идентификатор группы;

2) идентификатор издательства;

3) порядковый идентификатор книги;

4) контрольная цифра.

Hапример:  ISBN 5-05-000746-1, где

5 — идентификатор СССР;

06 — идентификатор издательства «Радуга»;

000746 — порядковый идентификатор книги;

1 — контрольная цифра.

3.5. Идентификатор группы устанавливается Международным агентством ISBN.

СССР присвоен однозначный идентификатор 5.

3.6. Идентификатор издательства присваивается Всесоюзной книжной палатой.

Идентификатор издательства вместе с идентификатором группы служит для идентификации издательства на международном уровне.

3.6.1. Идентификаторы издательства могут быть индивидуальными и собирательными.

Советским издательствам присвоены только индивидуальные идентификаторы.

3.6.2. Идентификатор издательства может содержать различное количество цифровых знаков (от двух до семи) в зависимости от объма выпускаемой книжной продукции.

Издательствам с большим объемом книжной продукции присваивается идентификатор с наименьшим количеством цифровых знаков. Издательством с небольшим объемом книжной продукции присваивается идентификатор с большим количеством цифровых знаков. Идентификаторы издательств устанавливается в пределах следующих диапазонов:

двузначные идентификаторы 00 – 19

трехзначные 200 – 609

четырехзначные 7000 – 0499

пятизначные 85000 – 09999

шестизначные 900000 – 949999

семизначные 9500000 – 9997999

3.7. Порядковый идентификатор книги служит для идентификации конкретного издания.

Порядковый идентификатор книги присваивается издательством.

3.7.1. Количество цифровых знаков порядкового идентификатора книги зависит от идентификатора издательства. Порядковый ISBN книги может содержать от одной до шести цифр. с таким расчетом, чтобы вместе с идентификатором группы, издательства и контрольной цифрой ISBN насчитывал десять цифр. Hапример:

ISBN 5-02-000000-0 («Hаука»)

ISBN 5-229-000000-0 («Металлургия»)

ISBN 5-85700-000-0 («Белорус. сов. энцикл.»)

ISBN 5-269-00000-0 («Сов. художник»)

3.0. Контрольная цифра служит для проверки правильности написания цифровой  части ISBN  и вычисляется следующим образом: каждая цифра, входящая в состав ISBN    умножается на числовой весовой коэффициент — от 10 до 2.

Результаты умножений на весовые коэффициент складываются. Сумма произведений делится на модуль 11 — (постоянный делитель).

Из модуля 11 вычитается остаток от деления, который и является контрольной цифрой. Если остатка нет, контрольной цифрой является  0, если остаток 10, он записывается как X. Hапример: