ФОРМАТЫ ЭЛЕКТРОННЫХ КНИГ И ДОКУМЕНТОВ

don-t-worry-it-won-t-byte.jpg

 

 

В последние несколько лет электронные книги продолжают стремительно завоёвывать популярность. Это происходит по многим причинам. Во-первых, за счёт роста числа пользователей Интернета, во-вторых, за счёт дороговизны или недоступности бумажных копий книг. Ещё одна причина распространенности книг электронного формата — это желание людей читать книги или материалы (статьи, журналы), которые вышли уже в электронном виде, но не вышли в бумажном. Сейчас есть периодические издания, которые выпускаются только в электронной форме.

В настоящее время существует несколько основных форматов, в которых хранятся электронные книги. Это – PDF, DjVu и PostScript (PS), CHM и форматы PDB, PRC (тексты для КПК).

PDF

Формат PDF, разработан компанией Adobe (расширение файлов – pdf) и в настоящее время является стандартом “де-факто” для электронного представления как технической, так и деловой электронной документации. Однако для хранения книг, включающих в себя большое количество полноцветных иллюстраций, этот формат не очень хорошо подходит, поскольку в этом случае файлы PDF получаются слишком большого объема.

Что касается просмотра файлов, то для этого пользователи Windows обычно используют (бесплатную) программу Adobe Reader или конецформыначалоформыFoxit Reader, компактную и быстро работающую программу для просмотра документов формата PDF.

Либо не менее бесплатную программу GhostView (обратите внимание, что для работы GhostView требуется программа GhostScript).

Создаются документы формата PDF – программой Adobe Acrobat Professional 7.0 и другими.

Открыв PDF файл в конецформыначалоформыAdobe Professional можно копировать и перемещатьтекст внутри PDF. Виртуально делая правый клик на любом файле, можно конвертировать его в PDF и если вы имеете открытый PDF файл, то можете сохранить его как почти любой тип файла (JPEG,HTML,DOC,etc…). Интегрированная Internet Explorer опция конвертирует любую вебстраницу в PDF.

Можно также сканировать и сохранить все страницы в JPEG и затем конвертировать все JPEG файлы в один PDF, используя Adobe Acrobat Professional 7.0. В таком случае вы не будите способны копировать, перемещать и выбирать текст внутри PDF файле.

Для сканирования и последущей конвертации в pdf можно использовать программу FineReader 7.0

Простая и удобная в использовании программа pdfFactory Pro для создания документов формата PDF, причем допускается установка запрета на редактирование документа, его шифрование и установка пароля на открытие. Поддерживаются “международные” шрифты (включая русские), имется режим предпросмотра, автосжатие документов, составление документа из нескольких, имеются и другие возможности, включая поддержку ссылок и закладок.

Программа Jaws PDF Creator, устанавливается как дополнительный принтер, и соответственно перегоняет в PDF все печатаемое.

DjVu

Формат DjVu, его файлы имеют расширение – djvu или – djv, (читается “де-жа-вю”, от фр. deja vu – “уже виденное”) разрабатывался специально для хранения отсканированных документов (книг, журналов, документации и пр.), т.е. растровых изображений. Первым и самым важным достоинством формата является существенно меньший размер файла при нормальном зрительном восприятии всех особенностей отображаемой страницы. Обычно DjVu сжимает в 5-10 раз лучше, чем существующие методы вроде JPEG и GIF для цветных документов, и в 3-8 раз лучше TIFF для черно-белых документов. Например, книга объёмом 300–400 страниц, отсканированная с разрешением 300 DPI (dots per inch, точек на дюйм), будет занимать 2–4 Мб.

Для просмотра DjVu в Windows используют программу WinDjView, во-вторых, специальный многоплатформенный плагин для браузера Internet Explorer, разработанный LizardTech. Обе программы являются бесплатными. WinDjView — очень маленькая и быстро работающая утилита, и по этой причине её использование предпочтительней. Однако она находится в данный момент в процессе разработки, поэтому, как и у всякого продукта, в ней возможны ошибки и глюки. Что касается плагина, то из преимуществ можно отметить то, что он позволяет просматривать DjVu-файлы прямо в браузере, а из недостатков — невысокую скорость работы и то, что его дистрибутив занимает несколько мегабайт.

Кроме того, для просмотра файлов в формате djvu используется программа DjVuReader. Существует также программа DjVu Solo, бесплатная разработка от LizardTech. Однако в настоящее время поддержка этого продукта прекращена. Это была достаточно хорошая программа, но она, например, не умела читать некоторые файлы с OCR (optical character recognition, оптическое распознавание текста), так что сейчас не рекомендуется её использовать.

Для сканирования и последующей конвертации в djvu можно использовать программу FineReader 8.0

Можно также сканировать с последующим редактированием.

Для сканирования интересующей вас книги также можно использовать просмотрщиком графических файлов: ACDsee, IrfanView или XnView.

Для создания книги, состоящей из текста, таблиц, схем и монохромных полутоновых иллюстраций, лучше выбрать TIFF без сжатия. В случае же сканирования чисто текстовых документов – оптимальным будет формат выходного файла TIFF CCITT Group 4, обеспечивающий очень качественное черно-белое изображение при минимальном его объеме. И уж никак не стоит выбирать для черно-белого файла формат JPEG, предназначенный исключительно для цветных изображений.

После того как бумажная книга отсканирована, полученные сканы нужно отредактировать. Для этого лучше всего воспользоваться специальной программой с характерным названием ScanKromsator. Для создания электронных книг в формате DjVu лучше всего воспользоваться редактором Document Express Editor 6. Старайтесь уложиться в лимит 10 Мбайт (если без иллюстраций, то это будет 300-400 страниц текста).

Варианты конвертации форматов: Djvu – Pdf и Pdf – Djvu

Печать на Acrobat Distiler (должна быть установлена полная версия акробата, а не только ридер) или на принтере pdfFactory.

Программы DjvuSolo и Adobe Acrobat Pro. Любой документ Djvu или PDF перегоняется в промежуточный, можно использовать tiff. И конвертируется в какой надо. Если исходить из удобства,то лучше PDF, если из экономии места, то лучше Djvu.

PostScript

Третий формат, в котором иногда попадаются электронные книги — это формат PostScript (PS). Он чем-то похож на формат PDF в том смысле, что PS-файлы обычно изготавливаются с помощью системы TeX (эти файлы легко отличить по высокому качеству изображения), и, кроме того, в PS можно конвертировать растровые изображения (в этом случае файл получается очень большой и, как правило, плохого качества).

Для просмотра файлов формата PS Windows-пользователи могут использовать уже упоминавшийся нами GhostView (обратите внимание, что для работы GhostView требуется программа GhostScript).

Необходимо отметить, что PS-файлы (поскольку сам формат фактически текстовый) очень часто встречаются в запакованном виде, чтобы уменьшить их объём. В этом случае они имеют расширение .ps.gz. Это означает, что они запакованы GZip-ом, и для их распаковки Windows-пользователи могут использовать архиватор WinRAR. Что касается GView, то эта программа умеет распаковывать .ps.gz-файлы самостоятельно, без использования внешних модулей.

CHM

HTMLHelp (Microsoft Compressed HTML Help, .CHM) — формат файлов контекстной справки, разработанный компанией «Майкрософт» и выпущенный в 1997 году в качестве замены формата WinHelp. Содержит в себе набор HTML-страниц, может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Все входящие в .CHM файлы сжаты алгоритмом LZX.

Для просмотра CHM-файлов используется стандартное средство просмотра, встроенное во все версии Windows,

Создаются chm файлы из html. Для этого имеются программы (html to chm compilers), например – htm2chm 3.0.9.3

PDB

PDB, PRC – форматы электронных книг для ручных компьютеров (тексты для КПК). конецформыначалоформыДля просмотра PDB в Windows используют программу – Isilo Reader.

Для преобразования информации из формата TXT в PDB, PRC и наоборот можно использовать программу DOCREADER для Windows.

Для конвертации в PDF можно использовать Adobe Acrobat Professional 8.0, инсталлирующий виртуальный принтер, который может создавать pdf файлы (однако линки не сохраняются).

Другая программа – ABC Amber Palm Converter, позволяет экспортировать в pdf и многие другие форматы.

Comments are closed.