Koreader:适用于 Kindle 的 PDF 文档重排插件

Koreader 是什么?Koreader怎么安装?Koreader怎么用?Kindle 伴侣向各位小伙伴介绍一个 Kindle 插件,堪称 PDF 文档重排神器,下面跟着 Kindle 伴侣一起体验一下吧!

目录

一、Koreader 是什么?
二、什么是 PDF 文档重排?
三、Koreader 如何重排 PDF 文档?
四、PDF 文档重排效果是什么样的?
1、重排带多栏排版的页面
2、重排带数学公式的页面
3、重排扫描版 PDF 文档
4、重排中文 PDF 文档(支持横排和竖排)
五、如何安装 Koreader?
1、首先越狱 Kindle
2、安装 Koreader
3、安装 KPVBooklet(可选)
4、固件升级导致失效怎么办?
六、如何使用 Koreader?
1、基本操作
2、PDF 文档重排参数调整
七、其他 Koreader 相关问题
软件升级
软件卸载

一、Koreader 是什么?

Koreader 是在 AGPL 协议下开放源代码的阅读软件,支持PDF, DJVU, EPUB, TXT, MOBI, XPS, CBZ, FB2, HTML, RTF, CHM, DOC, ZIP等几乎所有主流电子书文档格式。Koreader 默认运行在 Kindle 原生系统里,只需要在原生系统中打开 Koreader 程序就可以使用,关闭 Koreader 程序就回到了原生系统界面,切换很方便。目前Koreader可以运行在Kindle Touch和Kindle Paperwhite设备上。

二、什么是 PDF 文档重排?

使用6寸屏幕的 Kindle 阅读 PDF 文档时,如果该文档不是专门为小屏幕阅读器优化排版,会出现显示字体太小造成阅读不便的情况。加上Kindle的屏幕刷新率太低,以页面局部放大后再拖动页面区域阅读也很不方便。解决这一问题目前常用的方法有以下三种:

  • 1、用诸如 Briss 裁边软件去掉 PDF 文档页边空白使可阅读区域尽量大,再把裁边后的 PDF 文档放到 Kindle 中阅读。虽然经过这样处理,部分 PDF 文档可以获得比较好的阅读效果,但是仍有一部分文档经过处理之后的页面依然过大,不完美。
  • 2、使用OCR(光学字符识别)软件把 PDF 文档中的文字提取出来并转换为其他可重新排版的文档格式,如 txt 和 mobi 等。但是因为 OCR 识别存在一定的错误识别率,这种方法还不能保留文档原有的排版样式(如字体、字号和图表公式等),因此这种方法的应用范围有限,仍然不完美。
  • 3、使用阅读器提取出文档中的字符和样式,以适应屏幕宽度的方式重新排版(称为文字回流,Text Reflow)。这种方法虽然可以保留字体样式信息,但是对于图表和公式的支持和上一种方法一样不够好,而且这种方法的另一个缺陷是不能重排扫描版的文档,因为扫描版文档中无法提取出字符和格式信息,还是不完美。

三、Koreader 如何重排 PDF 文档?

Koreader 这款软件采用图像分割再重排的方式处理 PDF 文档(包括扫描和非扫描页面),这样不仅支持文字版PDF重排和数学公式的重排,还能对扫描版 PDF 和 DJVU 文档进行重新排版。重新排版后的文档,文字放大后可以适应屏幕自动换行,免去不断地左右拖动页面阅读。此外,Koreader 还有调整页面对比度、对文字加黑处理、自动切除页面白边、去除页面水印等实用功能。

Koreader 的重排功能依赖另一个开源软件项目K2pdfopt(GPLV3协议发布)。K2pdfopt 也是为了解决 PDF 文档在小屏幕 Kindle 上阅读的排版问题而开发的。与其它 PDF 预处理软件相比,它有自动化程度高等独一无二的特性,能够自动识别多栏排版的文档进行分栏、自动去除页面白边、自动对扫描文档进行水平校正以及最重要的基于图像分割的重排版算法。K2pdfopt 使用完全基于图像处理的方法对文字重新排版,软件处理时会把原始 PDF/DJVU 页面放大再分割成以词为单位的像素区域,把这些像素区域重新排列到目标宽度的页面中(原理如下图),所以理论上只要能够读取文档的页面像素就可以对其中的文字进行重新排版。这个算法的前提是页面中的文字之间需要有一定的空隙,以提供分割像素区域的位点。

K2pdfopt 重排 PDF 文档的原理

K2pdfopt 被移植到 Koreader 以后就可以在阅读时让 PDF 重新排版。实时重排可以省去电脑上处理 PDF 的步骤,并且可以在 kindle 上交互式地微调排版参数,尽可能地生成满意的排版。使用Koreader 的重排模式阅读时,软件会自动把当前页和下一页重排版成适应屏幕的尺寸。

四、PDF 文档重排效果是什么样的?

以下是 Koreader 重排功能在 Kindle 上的使用效果截屏,包括重排前的原始页面与重排后的页面对比图。

1、重排带多栏排版的页面

下图是Koreader对多栏排版的PDF页面带图和带样式的重排效果,左侧为重排前的原始页面,其中图像占据两栏的宽度,而重排之后图像仍然完整地显示,文字部分被重排为一栏显示:

Koreader 重排带图的分栏页面

2、重排带数学公式的页面

对PDF页面中的数学公式重排支持是Koreader的关键特性,因为使用文字提取的重排版方式对公式这种复杂排版样式的支持并不好,而Koreader的版式识别算法却可以获得较好的重排效果。左侧为重排前的原始页面,右侧是重排后的页面,字体放大了1.5倍仍然保持了公式的完整:

Koreader 重排带数学公式的页面

3、重排扫描版 PDF 文档

Koreader支持实体书扫描的PDF文档重排,重排效果如下。左侧为重排前的扫描PDF页面,右侧是重排后的页面:

Koreader 重排扫描版 PDF 文档

4、重排中文 PDF 文档(支持横排和竖排)

经过测试Koreader对大部分英文文档都可以获得很好的重排效果。而中文文档因为字间距太小,没有西文词之间的空格所以重排时应该选择较小的词间距。理论上只要中文字之间的间隔足够大,对中文文档也能获得很好的重排效果。这是对中文文档的重排测试(使用《红楼梦》脂评汇校本PDF文档)。左侧为重排前的PDF页面,右侧是重排后的页面。重排效果是字体样式全部保留,只增加了字体大小:

Koreader 重排中文 PDF 文档

重排中文竖排 PDF 文档效果(使用中华书局《点校本二十四史》扫描版PDF)。左上为重排前的原始页面,右上是重排使用的参数,使用了较小的字号、较小的词间距和90度旋转屏幕。下图是重排后的显示效果:

Koreader 重排中文竖排 PDF 文档效果

五、如何安装 Koreader?

安装 Koreader 的前提是 Kindle 设备必须越狱,并安装了 MRPI 和 KUAL。

1、首先越狱 Kindle

2、安装 Koreader

注意,Koreader 提供了三种版本,对应不同的 Kindle 设备型号,请按需选择:

  • Legacy:K2、DX、K3(及其它差异化版本)
  • Kindle:K4、K5、KPW1
  • PW2:KPW2 后的所有版本(如 KPW2、KV、KT2、KPW3、KOA、KT3、KOA2、KPW4、KT4)

★ 安装步骤:

  1. 首先确保安装了 MRPIKUAL
  2. 用 USB 数据线将 Kindle 连接到电脑上,直到出现 Kindle 磁盘;
  3. 解压缩下载到的 Koreader 压缩包,得到一个文件夹,内含 extensions 和 koreader 两个文件夹;
  4. 先把文件夹 extensions 中的内容拷贝到 Kindle 根目录下的 extensions 文件夹中;
  5. 然后把文件夹内的 koreader 文件夹拷贝到 kindle 根目录下;
  6. 通过 KUAL 菜单中启动 Koreader 并用它的文件浏览器打开并阅读电子书。

* 提示1:汉化 Koreader 菜单可下载 menu.json,替换根目录的 \extensions\koreader\menu.json
* 提示2:Koreader 的使用方法请参考《Koreader —— Kindle 的 PDF 文档重排插件》这篇文章。

3、安装 KPVBooklet(可选)

作为可选步骤,你还可以安装 KPVBooklet,其用途是在 Kindle 中直接显示原生系统不支持的 EPUB 等格式,并将其打开方式自动关联到 Koreader(还可通过 KUAL 菜单关联更多格式)。

★ 安装步骤:

  1. 解压缩下载到的 kpvbooklet 压缩包,得到一个文件夹;
  2. 把文件夹内的 update_kpvbooklet_xxx_install.bin 拷贝到 Kindle 里 mrpackages 文件夹中;
  3. 弹出 Kindle 磁盘,点击 Kindle 中的 kindle LAUNCHER,依次点击 Helper -> Install MR Packages
  4. 耐心等待 kpvbooklet 安装,直到安装完成后 Kindle 重启完毕。

* 提示:由于 KPVBooklet 已很久未更新,可能不兼容新版本固件中(晚于 2017-10-27)。

4、固件升级导致失效怎么办?

如果因升级到最新版本固件或未知原因导致此插件不能使用的,重新操作以上安装步骤即可恢复。

六、如何适用 Koreader?

Koreader可以通过KPVBooklet与原生系统集成,在原生系统主界面即可显示EPUB、DjVu等文档。默认使用Koreader打开PDF、EPUB、DjVu、FB2、CHM和DOC文档,使用原生系统自带阅读器打开MOBI、AZW和TXT文档。也可以长按PDF文档在弹出窗口中选择GOTO来使用原生阅读器打开PDF文档。

Kindle Paperwhite主界面

1、基本操作

在PDF阅读页面之后,点击屏幕顶部可打开文档菜单对话框,点击屏幕左侧可上翻页,点击屏幕右侧可下翻页,点击屏幕底部可打开设置对话框。

PDF阅读界面布局

在屏幕下方弹出的设置界面依次点击1-2-3可对当前文档页面重排。

Koreader 重排设置

2、PDF 文档重排参数调整

在Kindlepdfviewer的PDF阅读界面按“Aa”键可以调出重排参数调整界面进行排版微调。目前可调参数包括:字体大小、页边距、行间距、分词间距、对齐方式、最大栏数、水平较正、字体黑度、屏幕旋转等。如下图所示:

Koreader 排版参数微调

以下是各参数的使用方法(使用2012.11稳定版):

  • 换行重排(Reflow)开启时,选择不同的字号可以放大和缩小页面字体。注意实际显示的字体大小不一定与选择的大小完全相同。
  • 软件支持先切边后重排。切边(Trim Page)选择自动模式(auto)时,软件会自己选择切除页面白边,使内容区域最大化;也可以选择手动切边(manual)。
  • 软件能够自动识别并去除扫描PDF/DJVU页面上的污点(Defect),可选污点大小,默认使用中等(medium)大小。
  • 重排页面的页边距(Page Margin)有三档可调,默认为中等(medium)页边距。
  • 重排页面的行间距(Line Spacing)有三档可调,默认为中等(medium)行间距。
  • 重排过程中断词阈值使用词间距(Word Spacing/Word Gap)参数,建议中文文档选择较小(small)词间距,英文文档选择中等(medium)或较大(large)词间距。
  • 重排页面的渲染质量(Render Quality)有三档可调,选择高质量(high)显示效果最好但是重排时间也最长,选择低质量(low)重排时间可大幅缩短。默认使用高质量渲染。
  • 重排扫描PDF页面时可以对页面文字进行水平较正(Auto Straighten),数字表示最大校正角度,默认此选项关闭(最大校正角度为0),开启之后重排时间会大大增加,文字版PDF请勿打开。
  • 重排页面的对齐方式(Justification),有自动(auto)、左对齐(left)、居中(center)、右对齐(right)和两端对齐(full)可供选择。
  • 重排多栏排版的文档时可指定分栏数(Columns)。
  • 重排页面的字体黑度(Contrast)有5级可调,默认(default)字体黑度重排速度最快。
  • 支持0°、90°、180°和270°屏幕旋转,可使用90°旋转重排竖排版的文档。

如果原始页面正文四周有污点或者旁注,会影响程序判断正文的缩进方式,自动重排经常会出现大段空白和断行。手动切边把正文四周切掉之后再重排可以避免这种情况出现,让重排后的文档排版更整洁。使用方法见视屏演示,按“Aa”键调出重排参数调整对话框,在切边(Trim Page)选项中选择手动切边(manual),使用五向键的确认键打开原始页面视图,首先通过五向键调整切边的左上角,确认左上角之后再调整切边右下角。确认之后重排即使用切边以后的页面。对于大部分文档,一般不需要每一页都做手动切边,如果当前页码是奇数页,之后遇到奇数页就会自动使用当前页面的切边信息。

七、其他 Koreader 相关问题

1、软件升级

下载最新版 Koreader/Kindlepdfviewer 软件包,把ZIP文件包解压缩到Kindle磁盘根目录,即可升级安装 Koreader/Kindlepdfviewer。

2、软件卸载

如需卸载请直接删除 Kindle 下的 Koreader/kindlepdfviewer 目录, 把安装过的对应软件的 uninstall 文件逐一拷贝到 Kindle 磁盘根目录,点“Update Your Kindle”即可卸载相应软件。

原文:http://vislab.bjmu.edu.cn/blog/hwangxin/2012/10/read-scanned-pdfs-with-kindlepdfviewer

有帮助,分享给其他小伙伴:

发表评论

标注为 * 的是必填项。您填写的邮箱地址将会被保密。如果是在本站首次留言,审核后才能显示。
若提问,请务必描述清楚该问题的前因后果,提供尽可能多的对分析该问题有帮助的线索。

小伙伴们发表了 193 条评论

  1. 哇,折腾了挺久,终于搞好了,一开始安装的是正文里的Koreader,然后发现各种不兼容以及系统崩溃….结果发现哪个是kpw2版本的,才会导致kpw1系统各种崩溃……后来看见评论区中的legacy版本后下载才终于没有太大问题了….感谢书伴的分享与指引!
    (还有一个疑问,legacy的下载网盘中有两个文件,一个带legacy一个不带,用哪个会更稳定一些呢…)

      • 好的,感谢指引!
        这里还有一个小状况:即使安装了对应正确版本的插件,在Koreader运行过程中也会有概率出现无限重启,koreader和重启界面混杂错误显示,必须长按电源键重启才可以退回到原系统解决,请问这是我的使用方式有问题还是越狱后系统本身的问题?(kpw1,安装版本2021.2最新版)求解答,谢谢orz

        • 也有可能是 Koreader 自身的问题,你可以尝试一下其它(较低的)版本,看是否会出现同样的问题。

  2. 我应该想到的, KPVBooklet的最后一次更新是在2017年,而kpw4实在2018年10月发布的,所以肯定装不了,难受。希望会有更新吧。这样打开epub有点不太方便。我在前面那条关于 KPVBooklet的留言请不要显示,谢谢。

  3. 文本重排之后,有些页面首行与末行显示不完整,有些页面末行在下一页首行重复出现,请问该如何处理?

  4. 请问我的书大部分都是pdf的 用了calibre改了书的封面后 再转成mobi 排版全乱了 这应该怎么办呀

    • 如果想保持 PDF 的排版,不建议转换成 MOBI 格式,因为 Calibre 只是简单地把 PDF 的内容提取出来转换成其它格式,不会保持原有排版。换句话说,只有纯文本的 PDF(无特殊排版、无图表公式等元素)适合转换成 MOBI 格式,

  5. 如何把之前的koreader卸载掉后更换?以后如何升级?可以分享下详细的步骤吗?

  6. 想在Koreader官网下载一个适合kindle paperwite1的Koreader软件,可是每次下载一半就不能下载了,是否可以分享个相关软件?

  7. 希望楼主能有空搬运一下Koreader能用的字典资源,找了好久只找到很早以前的,还不全

  8. 你好!我曾经不知道在哪个页面下载了一些文件,使koreader可以识别扫描版的pdf中的英文(只支持英文)。现在知道koreader本身具备这个功能,下载tesseract就可以了,中英文都可以支持。想删除以前下载的支持英文识别的文件,但是找不到那个页面了。您知道在哪里吗?

  9. 你好,官网3个版本的Koreader,应该选哪一个,还是都可以?
    koreader-kindle-arm-kindle5-linux-gnueabi-v2019.07.zip
    33.8 MB
    koreader-kindle-legacy-arm-kindle-linux-gnueabi-v2019.07.zip
    34.2 MB
    koreader-kindlepw2-arm-kindlepw2-linux-gnueabi-v2019.07.zip

      • 我之前有可能下错了。直接用新版覆盖,还是要删除旧版的?之前有段时间闪退,不知道是不是因为版本错了。

      • 我已经解决啦,把旧的文件夹删除了,拖入新版的,使用正常!谢谢你!