也许从电脑诞生开始,在电子屏幕上阅读书籍就注定会成为一种普遍习惯。在移动互联网远远还没到来的时代,和我年龄相差不大的80后、90后们,大多有过在互联网上寻找TXT格式的网络小说,导入到学习机、电子词典、MP3播放器里的经历。
显然,在这些设备上看纯文本格式的书籍,并不是一种很舒适的体验。21世纪的第一个十年,很多MP3播放器虽然带有小小的屏幕,也能打开TXT文本文件,但没有翻页到指定页的功能,也没有阅读进度记忆。可想而知,翻页按键要经历怎样的摧残,才能让机主看完几本百万字的长篇小说。
Kindle电子书阅读器的诞生彻底改变了电子书的消费方式和阅读方式,也改变了整个图书出版业。在我看来,Kindle的意义,不亚于苹果的iOS生态。不过2023年,亚马逊Kindle正式退出中国,2024年甚至不能下载已购的书籍。作为一个在Kindle电子书商店消费了几千元的用户,我完全无法接受亚马逊这种背弃用户的商业行为。
但无论如何,我只能寻找替代方案了。如今,Kindle已经正式关停2年,微信读书App成为难以挑战的市场老大,而我曾经已购的书籍散落在Kindle、京东读书、网易云阅读、当当读书、豆瓣读书等App里面。让我再到微信读书里边购买大量书籍,或每年开会员,几乎不可能了,毕竟谁知道微信读书何时又会变成下一个Kindle。所以,最后我的决定是Z-Library下载书籍,存储到NAS,用Calibre和Calibre-web管理,按需导入到微信读书、阅读App等阅读器软件里阅读。
然后问题就来了,长期保存和管理电子书文件,用哪种格式呢?我选择了最开放的EPUB,但也同时来讲讲其他选择。
TXT:
20世纪70年代,TXT作为最早的纯文本格式诞生,没有特定发明者,更像是计算机发展的自然产物。它的文件体积仅有几KB,任何设备都能打开,如同数字世界的“竹简”。迈克尔·哈特1971年发起的“古腾堡计划”,用TXT保存《独立宣言》,开启了电子书先河。但缺乏排版、图片支持的特性,让它注定成为网络文学爱好者“手抄本”般的存在。
TXT是“纯文本”编码,也就是说没有排版没有格式可言,特定字体、段落、图文混排这些都无法实现。而无论电子书还是纸质出版物,排版是可读性的基本保证。因此,人们很快就转向了富文本格式。网页端HTML、XML均是富文本格式标记语言,电子书领域,互联网巨头们同样做出了努力。
RTF:微软的初次尝试
1993年,微软推出RTF(Rich Text Format),首次实现字体、颜色的跨平台保存。尽管主要用于办公文档,却为后来的结构化电子书埋下伏笔。它的兼容性覆盖Windows、Mac和早期Linux系统,甚至能在DOS环境下运行。但由于不支持目录导航和复杂版式,始终未能在电子书领域普及,更像是文字处理软件间的“信使”。
在Windows 11之前的系统,你打开系统自带的“写字板”,保存到文件就是RTF。在Windows 11上仍然可以创建RTF文件,不过系统已经没有内置写字板软件了,可以改用Word编辑。
CHM:Window Help的无心插柳
1998年微软发布的CHM(Compiled HTML Help),本是Windows帮助系统的专属格式,却因支持超链接、目录树和JavaScript交互,意外成为早期电子书的载体。许多技术手册和《大英百科全书》光盘版采用此格式,在Windows 98电脑上实现“点击跳转”的阅读体验。但随着移动互联网兴起,其依赖Windows系统的局限性显露,逐渐被网页技术取代。
在EPUB普及率不高的时代,很多盗版的电子书均提供CHM格式下载。
PDF:所见即所得
1993年Adobe推出的PDF,完美复现纸质书的版式细节,创始人查尔斯·格施克将印刷行业的PostScript语言改造为“数字纸张”。学术论文、政府文件至今依赖其精准排版,但6英寸电纸书上阅读学术PDF的体验,如同“在邮票上观赏油画”,文件体积大、自适应差的问题始终存在。
FB2:俄语世界的结构化实验
2004年俄罗斯开发者推出的FictionBook(FB2),采用XML标记语言定义章节、注释甚至诗歌格式。其自动生成目录、注释联动的特性,成为俄语学术出版的首选。但由于缺乏商业推广,始终困于东欧市场,如同数字时代的“西夏文”,在全球化浪潮中保持着小众生命力。
EPUB:开放生态的破壁者
2007年国际数字出版论坛发布的EPUB标准,基于HTML5技术实现图文自适应排版。中国多看阅读团队2010年破解Kindle系统植入EPUB支持,如同“数字盗火者”。其文件体积仅为同类PDF的1/3,却因各家阅读器渲染标准不一,常出现字体错乱、图片位移的“兼容性谜题”。
MOBI/AZW3:亚马逊的生态锁链
2007年随Kindle问世的MOBI格式,实为EPUB的加密变体。亚马逊通过DRM技术将用户锁定在自有生态,2011年升级的AZW3增加复杂排版支持,却禁止跨设备同步。中国用户曾通过刷机安装多看系统破解限制,这场“技术游击战”持续十年,直到2023年Kindle退出中国市场。
PDG:古籍数字化的东方智慧
1993年中国超星公司研发的PDG格式,采用JBIG压缩技术,将《四库全书》扫描件体积压缩至原件的5%。这种专为古籍设计的格式,在方正阿帕比阅读器上完美呈现竖排文字与篆书异体字,却因商业封闭性,最终困在学术机构的局域网中。
UMD:功能机时代的阅读狂欢
诺基亚主导的UMD格式,曾借助N73等机型在亚洲风靡。2.4英寸屏幕上,《第一次亲密接触》等网络小说以每屏70字的节奏滚动,催生出独特的“拇指阅读”文化。随着智能手机普及,这种专为小屏优化的格式,如同BP机般成为时代剪影。
每种格式都是特定技术条件的产物:TXT的极简主义仍在命令行界面闪烁,PDF的印刷执念守护着学术尊严,EPUB的开放精神对抗着商业垄断。当我们在柔性屏上滑动阅读时,这些格式如同地质岩层,记录着数字文明的一次次脉动。
微信扫描下方的二维码阅读本文