想自制epub电子书?先了解一下它的构造吧

首先说明的是,这里的电子书,特指epub格式的电子书,而不是亚马逊家的电子书。因为epub很大众,是国际公认的电子出版格式。而亚马逊家,家大业大,就自己搞了一套标准。下面我们先从了解什么是epub开始。

1.什么是ePub?

「ePub」格式,是由国际数字出版论坛(IDPF)所提出的:用类似网页的XML架构,让电子书的文字可以在不同的电子阅读设备进行内容重排的数字出版品内容组织与应用规范。

可以看出,它强调的是同一文字在不同阅读器的共通性,也就是说,不要求纸书那样独特的排版设计,关键是能在不同阅读器上正确呈现内容,这才是ePub的主要目的。

2.ePub档案其实是一个压缩文件

它其实是一个zip压缩文件,把要形成ePub的文件全部用压缩软体压缩成.zip文件之后,接着将附件名从.zip改成.epub就变成了ePub文件了,就这么简单。

正因为ePub是个压缩文件,所以我闷要看清它的内部结构就很好办了,你只需要

(a)先把文件的格式从.epub改成.zip

(b)然后用普通的解压缩软件解压缩,就可以看到ePub里面具体都有哪些文件。

3.ePub文件和网页的关系

打开压缩文件之后会发现有很多html的文件。大家知道html文件就是网页,其实基本上ePub文件就是就是很多网页的结合。你还记得浏览网页的时候,滚动鼠标滑轮,网页的字也会跟着缩放吗?在电子书的设计上,就是采用了这种特性。

4.ePub的结构

ePub的格式包括了三个部分:OCF、OPS及OPF。下面我们一一解说下。

5.OCF (Open Container Format)开放容器格式

OPF是ePub压缩及封包的规范,简单来说,就是规范ePub用压缩软件,压成.zip文件。

6.OPF (Open Packaging Format)开放包装格式

OPF是负责导览和目录的部份。可以说是一个电子书里的「根文件」。它记录着这本电子书里的封面、目录、前言、各章节的html连结。

其中包括了

(a) metadata:元资料,也就是书籍资料。记录了书籍的相关资讯,好像纸书的版权页一样。

(b) manifest:(电子书内容物)清单:包括文件名称和id连结。(id=”文件”)

(c) spine:控制阅读的顺序。调整ID会改变电子书里章节出现的顺序。

(d) guide:导读部分,负责辅助阅读的结构。比方说给盲人的有声书部分。

(e)在OPF之外常常会看到toc.ncx,这个是给程序读的目录档案。

7.OPS (Open Publication Structure)开放出版结构

OPS是一个电子书主要的内容及标记部分。也是我们制作电子书时主要要处理的部份。先前提到的XML的架构,就是指在这边出现的内容,是以XML的格式出现的。XML格式的文件,意思就是我们在本来的内文里下标记,让电脑知道哪些文字是标题,哪些文字是小标题,及哪些文字是内文等等。

8.ePub文件结构的另一点说明

就像上面说到的,先有最底层的OPS内容,然后再通过OPF负责导览和目录的部份。最后再以OCF规范用zip压缩文件,最终就变成了ePub文件。

有时候在比较新的ePub生成工具里,OPF和OPS会合成一个资料夹,叫做OEBPS。不过不管怎么样,在内容上面,ePub包括了:

(a).opf档

(b).ncx档

(c)内容html档

(d)附加插图的图档

(e) META-INF资料夹,里面有container.xml文件,告诉电子阅读机器要去哪里读OPF文件。

9.说了这么多,到底有哪些制作ePub的工具呢?需要的相关软体

开发ePub电子书需要的软件包括:

ePub电子书制作工具:eCub、Calibre、Adobe InDesign CS5

ePub电子书阅读工具:Adobe digital edition、Sony eLibrary、Calibre…

ePub电子书编辑工具:PDFXML Inspector、SIGIL

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注