Koreader —— Kindle 的 PDF 文档重排插件

KOReader 是什么?KOReader怎么安装?KOReader怎么用?Kindle 伴侣向各位小伙伴介绍一个 Kindle 插件,堪称 PDF 文档重排神器,下面跟着 Kindle 伴侣一起体验一下吧!

目录

一、KOReader 是什么?
二、什么是 PDF 文档重排?
三、Koreader 如何重排 PDF 文档?
四、PDF 文档重排效果是什么样的?
1、重排带多栏排版的页面
2、重排带数学公式的页面
3、重排扫描版 PDF 文档
4、重排中文 PDF 文档(支持横排和竖排)
五、KOReader 怎么安装?
1、首先越狱 Kindle
2、然后安装 KPVBooklet
3、最后安装 Koreader
4、原生系统固件升级了怎么办?
六、KOReader 如何使用?
1、基本操作
2、PDF 文档重排参数调整
3、手动切边(视频演示)
七、其他 KOReader 相关问题
软件升级
软件卸载

一、KOReader 是什么?

Koreader 是在 AGPL 协议下开放源代码的阅读软件,支持PDF, DJVU, EPUB, TXT, MOBI, XPS, CBZ, FB2, HTML, RTF, CHM, DOC, ZIP等几乎所有主流电子书文档格式。Koreader 默认运行在 Kindle 原生系统里,只需要在原生系统中打开 Koreader 程序就可以使用,关闭 Koreader 程序就回到了原生系统界面,切换很方便。目前Koreader可以运行在Kindle Touch和Kindle Paperwhite设备上。

二、什么是 PDF 文档重排?

使用6寸屏幕的 Kindle 阅读 PDF 文档时,如果该文档不是专门为小屏幕阅读器优化排版,会出现显示字体太小造成阅读不便的情况。加上Kindle的屏幕刷新率太低,以页面局部放大后再拖动页面区域阅读也很不方便。解决这一问题目前常用的方法有以下三种:

  • 1、用诸如 Briss 裁边软件去掉 PDF 文档页边空白使可阅读区域尽量大,再把裁边后的 PDF 文档放到 Kindle 中阅读。虽然经过这样处理,部分 PDF 文档可以获得比较好的阅读效果,但是仍有一部分文档经过处理之后的页面依然过大,不完美。
  • 2、使用OCR(光学字符识别)软件把 PDF 文档中的文字提取出来并转换为其他可重新排版的文档格式,如 txt 和 mobi 等。但是因为 OCR 识别存在一定的错误识别率,这种方法还不能保留文档原有的排版样式(如字体、字号和图表公式等),因此这种方法的应用范围有限,仍然不完美。
  • 3、使用阅读器提取出文档中的字符和样式,以适应屏幕宽度的方式重新排版(称为文字回流,Text Reflow)。这种方法虽然可以保留字体样式信息,但是对于图表和公式的支持和上一种方法一样不够好,而且这种方法的另一个缺陷是不能重排扫描版的文档,因为扫描版文档中无法提取出字符和格式信息,还是不完美。

三、Koreader 如何重排 PDF 文档?

Koreader 这款软件采用图像分割再重排的方式处理 PDF 文档(包括扫描和非扫描页面),这样不仅支持文字版PDF重排和数学公式的重排,还能对扫描版 PDF 和 DJVU 文档进行重新排版。重新排版后的文档,文字放大后可以适应屏幕自动换行,免去不断地左右拖动页面阅读。此外,KOReader 还有调整页面对比度、对文字加黑处理、自动切除页面白边、去除页面水印等实用功能。

Koreader 的重排功能依赖另一个开源软件项目K2pdfopt(GPLV3协议发布)。K2pdfopt 也是为了解决 PDF 文档在小屏幕 Kindle 上阅读的排版问题而开发的。与其它 PDF 预处理软件相比,它有自动化程度高等独一无二的特性,能够自动识别多栏排版的文档进行分栏、自动去除页面白边、自动对扫描文档进行水平校正以及最重要的基于图像分割的重排版算法。K2pdfopt 使用完全基于图像处理的方法对文字重新排版,软件处理时会把原始 PDF/DJVU 页面放大再分割成以词为单位的像素区域,把这些像素区域重新排列到目标宽度的页面中(原理如下图),所以理论上只要能够读取文档的页面像素就可以对其中的文字进行重新排版。这个算法的前提是页面中的文字之间需要有一定的空隙,以提供分割像素区域的位点。

K2pdfopt 重排 PDF 文档的原理

K2pdfopt 被移植到 Koreader 以后就可以在阅读时让 PDF 重新排版。实时重排可以省去电脑上处理 PDF 的步骤,并且可以在 kindle 上交互式地微调排版参数,尽可能地生成满意的排版。使用Koreader 的重排模式阅读时,软件会自动把当前页和下一页重排版成适应屏幕的尺寸。

四、PDF 文档重排效果是什么样的?

以下是 Koreader 重排功能在 Kindle 上的使用效果截屏,包括重排前的原始页面与重排后的页面对比图。

1、重排带多栏排版的页面

下图是Koreader对多栏排版的PDF页面带图和带样式的重排效果,左侧为重排前的原始页面,其中图像占据两栏的宽度,而重排之后图像仍然完整地显示,文字部分被重排为一栏显示:

Koreader 重排带图的分栏页面

2、重排带数学公式的页面

对PDF页面中的数学公式重排支持是Koreader的关键特性,因为使用文字提取的重排版方式对公式这种复杂排版样式的支持并不好,而Koreader的版式识别算法却可以获得较好的重排效果。左侧为重排前的原始页面,右侧是重排后的页面,字体放大了1.5倍仍然保持了公式的完整:

Koreader 重排带数学公式的页面

3、重排扫描版 PDF 文档

Koreader支持实体书扫描的PDF文档重排,重排效果如下。左侧为重排前的扫描PDF页面,右侧是重排后的页面:

Koreader 重排扫描版 PDF 文档

4、重排中文 PDF 文档(支持横排和竖排)

经过测试Koreader对大部分英文文档都可以获得很好的重排效果。而中文文档因为字间距太小,没有西文词之间的空格所以重排时应该选择较小的词间距。理论上只要中文字之间的间隔足够大,对中文文档也能获得很好的重排效果。这是对中文文档的重排测试(使用《红楼梦》脂评汇校本PDF文档)。左侧为重排前的PDF页面,右侧是重排后的页面。重排效果是字体样式全部保留,只增加了字体大小:

Koreader 重排中文 PDF 文档

重排中文竖排 PDF 文档效果(使用中华书局《点校本二十四史》扫描版PDF)。左上为重排前的原始页面,右上是重排使用的参数,使用了较小的字号、较小的词间距和90度旋转屏幕。下图是重排后的显示效果:

Koreader 重排中文竖排 PDF 文档效果

五、KOReader 怎么安装?

这里主要以 Kindle Paperwrite 或 Kindle Touch 为例。要在 Kindle 上安装插件必须对设备进行越狱(Jailbreak);而后需要安装 Koreader 依赖的 KPVBooklet;最后安装 Koreader。

1、首先越狱 Kindle

2、然后安装 KPVBooklet

KPVBooklet 的安装包下载官方下载 | 百度网盘(v0.6.4)

  • 首先确保安装了 KUAL 及其插件 MRPI
  • 用 USB 数据线将 Kindle 连接到电脑上,直到出现 Kindle 磁盘;
  • 解压缩下载到的 kpvbooklet 压缩包,得到一个文件夹;
  • 把文件夹内的 update_kpvbooklet_xxx_install.bin 拷贝到 Kindle 里 mrpackages 文件夹中;
  • 弹出 Kindle 磁盘,打开 kindle LAUNCHER,依次点击 Helper -> Install MR Packages
  • 耐心等待 kpvbooklet 安装,直到安装完成后 Kindle 重启完毕;

3、最后安装 Koreader

Koreader 软件下载:官方下载百度网盘(20171023)

下载最新的 Koreader 安装包。将下载的 koreader-kindle-arm-linux-gnueabi-*.zip 文件解压缩后得到的两个目录(extensions 和 koreader)拷贝到 Kindle 磁盘根目录,断开 Kindle 和电脑的USB连接。在 Kindle 主界面即可直接用 Koreader 打开 PDF 和 EPUB 文档。

4、原生系统固件升级了怎么办?

开启WIFI的情况下原生系统可能会在后台自动升级固件。不管手动固件升级还是自动固件升级都会擦除KPVBooklet启动器造成Koreader无法启动,解决这个问题只需要升级完成后重新安装KPVBooklet即可,Koreader无需重新安装。

* 升级安装 KPVBooklet 只需下载最新 KPVBooklet 安装包,使用安装 bin 文件升级。
* Update Your Kindle 显示为灰色可能是因为安装了特定版本的多看,可在 Kindle 磁盘根目录下创建一个名为 DUOKAN_DISABLE 的文件,然后重启机器再安装。

六、KOReader 如何使用?

Koreader可以通过KPVBooklet与原生系统集成,在原生系统主界面即可显示EPUB、DjVu等文档。默认使用Koreader打开PDF、EPUB、DjVu、FB2、CHM和DOC文档,使用原生系统自带阅读器打开MOBI、AZW和TXT文档。也可以长按PDF文档在弹出窗口中选择GOTO来使用原生阅读器打开PDF文档。

Kindle Paperwhite主界面

1、基本操作

在PDF阅读页面之后,点击屏幕顶部可打开文档菜单对话框,点击屏幕左侧可上翻页,点击屏幕右侧可下翻页,点击屏幕底部可打开设置对话框。

PDF阅读界面布局

在屏幕下方弹出的设置界面依次点击1-2-3可对当前文档页面重排。

Koreader 重排设置

2、PDF 文档重排参数调整

在Kindlepdfviewer的PDF阅读界面按“Aa”键可以调出重排参数调整界面进行排版微调。目前可调参数包括:字体大小、页边距、行间距、分词间距、对齐方式、最大栏数、水平较正、字体黑度、屏幕旋转等。如下图所示:

Koreader 排版参数微调

以下是各参数的使用方法(使用2012.11稳定版):

  • 换行重排(Reflow)开启时,选择不同的字号可以放大和缩小页面字体。注意实际显示的字体大小不一定与选择的大小完全相同。
  • 软件支持先切边后重排。切边(Trim Page)选择自动模式(auto)时,软件会自己选择切除页面白边,使内容区域最大化;也可以选择手动切边(manual)。
  • 软件能够自动识别并去除扫描PDF/DJVU页面上的污点(Defect),可选污点大小,默认使用中等(medium)大小。
  • 重排页面的页边距(Page Margin)有三档可调,默认为中等(medium)页边距。
  • 重排页面的行间距(Line Spacing)有三档可调,默认为中等(medium)行间距。
  • 重排过程中断词阈值使用词间距(Word Spacing/Word Gap)参数,建议中文文档选择较小(small)词间距,英文文档选择中等(medium)或较大(large)词间距。
  • 重排页面的渲染质量(Render Quality)有三档可调,选择高质量(high)显示效果最好但是重排时间也最长,选择低质量(low)重排时间可大幅缩短。默认使用高质量渲染。
  • 重排扫描PDF页面时可以对页面文字进行水平较正(Auto Straighten),数字表示最大校正角度,默认此选项关闭(最大校正角度为0),开启之后重排时间会大大增加,文字版PDF请勿打开。
  • 重排页面的对齐方式(Justification),有自动(auto)、左对齐(left)、居中(center)、右对齐(right)和两端对齐(full)可供选择。
  • 重排多栏排版的文档时可指定分栏数(Columns)。
  • 重排页面的字体黑度(Contrast)有5级可调,默认(default)字体黑度重排速度最快。
  • 支持0°、90°、180°和270°屏幕旋转,可使用90°旋转重排竖排版的文档。

如果原始页面正文四周有污点或者旁注,会影响程序判断正文的缩进方式,自动重排经常会出现大段空白和断行。手动切边把正文四周切掉之后再重排可以避免这种情况出现,让重排后的文档排版更整洁。使用方法见视屏演示,按“Aa”键调出重排参数调整对话框,在切边(Trim Page)选项中选择手动切边(manual),使用五向键的确认键打开原始页面视图,首先通过五向键调整切边的左上角,确认左上角之后再调整切边右下角。确认之后重排即使用切边以后的页面。对于大部分文档,一般不需要每一页都做手动切边,如果当前页码是奇数页,之后遇到奇数页就会自动使用当前页面的切边信息。

3、手动切边(视频演示)

(测试使用商务印书馆《汉译世界学术名著》丛书PDF文档)

* 如果遇到视频无法播放的情况请使用较新的 Chrome 或者 Firefox 浏览器重新打开本网页。

七、其他 KOReader 相关问题

1、软件升级

下载最新版 Koreader/Kindlepdfviewer 软件包,把ZIP文件包解压缩到Kindle磁盘根目录,即可升级安装 Koreader/Kindlepdfviewer。

2、软件卸载

如需卸载请直接删除 Kindle 下的 koreader/kindlepdfviewer 目录, 把安装过的对应软件的 uninstall 文件逐一拷贝到 Kindle 磁盘根目录,点“Update Your Kindle”即可卸载相应软件。

原文:http://vislab.bjmu.edu.cn/blog/hwangxin/2012/10/read-scanned-pdfs-with-kindlepdfviewer

有帮助,[ 捐助本站 ] 或分享给小伙伴:

发表评论

标注为 * 的是必填项。您填写的邮箱地址将会被保密。如果是在本站首次留言,审核后才能显示。
若提问,请务必描述清楚该问题的前因后果,提供尽可能多的对分析该问题有帮助的线索。

小伙伴们发表了 134 条评论

  1. koreader.ak-team.com中有几类文件。1.带kindle5字样;2.legacy;这个是支持老设备的?3.kindlepw2,这个似乎是 kpw2?4.kobo,这个是支持kobo的!5.pocketbook,
    kpw3应该下载那个?没有看到那地方有说明文件!

  2. 萌新一个,为什么我用koreader打开epub格式文件超级的慢,epub越大打开的速度就越慢,一个11M的epub居然要10多分钟才打开的了,并且退出koreader和打开一样要漫长等待感觉更久。还有就是koreader打开mobi也是一样的慢不过比epub好上一些,可是明明系统里是秒开的,并且有些文件在koreader上出现的是乱码系统下打开却没问题(可能是文件问题)。我用的机子是KPW3漫画版,系统是5.8.11,开始koreader用的是书伴里的V2015.11.1370版本,后面去官网下了V2015.11.1523版本,可是一个样

  3. 站长您好,前一阵购买了kindle558入门版,买的时候就让商家破解装了ko,手残重置了系统,通过教程恢复了越狱并且安装了kual和ko,设备版本5.8.0,多次重新安装kv,打开PDF,TXT和epub格式文件依然显示‘应用程序出错,无法选定的应用系统请重试’且分类为个人文档,目前只能打开mobi文件,请问这个问题该如何解决?

    • 之前有小伙伴反馈,把固件升级到最新版本,并安装最新版本的 Koreader 和 KPVBooklet,可以解决这个问题。

  4. GitHub里的koreader-kindle-arm-linux-gnueabi-v2015.11-1370-g5ee6c01.zip和koreader-kindle-legacy-arm-kindle-linux-gnueabi-v2015.11-1370-g5ee6c01.zip两个安装包有什么区别?

    • 两者适用的设备不同,koreader-kindle-legacy-arm-*.zip 适用于较旧的 Kindle 设备:kindle2、kindle3、kindle4、kinde DXG,而 koreader-kindle-arm-*.zip 适用于较新的 Kindle 设备:kindle touch、kindle paperwhite、kindle voyage、kindle oasis。