Calibre 使用教程之电子书繁体字转简体字

有没有电子书的简繁体转换方法?如何才能把繁体电子书转换成简体?对于习惯了阅读简体汉字的小伙伴,在遇到繁体版电子书时都会遇到这样的问题,在本文中 Kindle 伴侣就给大家介绍一个比较实用的 Calibre 使用技巧,把电子书中的繁体字转换成你所熟悉的简体字。

一、下载转换规则词库

这里的电子书繁体字转简体字的原理是利用了 Calibre 的“查找与替换”功能,此功能可以在转换电子书的同时,根据提供的“替换规则”实时地对电子书内容进行搜索并替换。这里的“替换规则”由“搜索正则表达式”和“替换文本”组成,当然这些替换规则我们不需要手动一个个去输入,已经有网友提供了比较全面的词库规则,可以直接拿来使用。

这里推荐 HiPDA 论坛的 fengcuo 提供的词库规则。此词库依 Calibre 替换规则对词库进行了校对,增加新字词、繁简对换、修改规则、重排、全词库去重、去繁简同型词组,并修正了由时代进步而呆滞的词组变更。最新版本的词库有 4989 对(含标点)。

由于简繁存在“一简对多繁”和“一繁对多简”,普通的转换可能会出现丢字(如“後来”不转换)、错换(如“著名”转成“着名”,“甚麽”转成“什麽”)和不转换标点符号的问题。有了专门校正过的词库规则就可以很好的避免这些问题,让行文阅读起来更加流畅。

词库规则下载百度网盘(最新版请关注原帖

二、繁体转简体操作步骤

这里以胡适等著的《怎样读书》繁体版作为示例演示操作步骤:

  1. 打开 Calibre,把“怎样读书.epub”[注1]拖放到 Calibre 的书库中;
  2. 右键点击该电子书,在弹出的菜单中将鼠标移动到“转换书籍 -> 逐个转换”;
  3. 点击“逐个转换”调出转换窗口后,点击窗口左侧的“查找与替换”转到查找替换界面(下图);
  4. 在窗口的右侧操作区点击【加载】按钮,选取刚才下载的 .csr 文件;
  5. 点击【确定】开始转换,等待转换完毕即可得到转换成简体字内容的 mobi 文件[注2]

Calibre_T2S_1

繁转简最终效果:

T2S_1

T2S_2

三、自定义转换规则

虽然该词库已经够大,基本囊括了各常见领域专有名词,但是由于汉语也在演变,且有少部分人名(如个别古人名)等专有名词还是需要部分繁体显示的,所以很难 100% 完美。如果转换完后感觉有个别字词没有转换或者转换错误,可以按照下面方法添加自定义转换规则到规则列表中。

Calibre_T2S_2

在“查找与替换”界面依次操作:

  1. 在“查找正则表达式”栏目填写目标字词;
  2. 在“替换文本”栏目填写替换字词;
  3. 点击【添加】按钮把这条替换规则添加到规则中,点击【保存】。

以上。希望对有需要的小伙伴有所帮助。如果您对原字库规则做了比较多的修正,可以点击这里向原字库规则提供者反馈,帮助他完善,以便造福更多的 Kindler,谢谢。

——————

[注1] 这里只是用 EPUB 格式电子书举例说明,使用其他 AZW、AZW3、MOBI、TXT 等源格式都可以,只要 Calibre 支持此格式的转换。

[注2] 这里只是以转换成 Kindle 支持的 MOBI 格式电子书举例,选择转换成其他 AZW、AZW3 等 Kindle 支持的格式也是可以的。

——————

参考资料:Calibre -繁体转简体批处理-增强扩展词组!

有帮助,[ 捐助本站 ] 或分享给小伙伴:

发表评论

标注为 * 的是必填项。您填写的邮箱地址将会被保密。如果是在本站首次留言,审核后才能显示。
若提问,请务必描述清楚该问题的前因后果,提供尽可能多的对分析该问题有帮助的线索。

小伙伴们发表了 8 条评论

  1. 因为Hi!PDA论坛的注册审核原因,无法将bug反馈给原贴主,请有账号的朋友反馈一下:
    1. 最大的问题在于“拾”和“十”的简繁转换,导致如下短语出错:
    带拾字的词语
    拾夺拾诵拾尘拾骨
    拾拣拾芥招拾援拾
    整拾拾荒拾集诵拾
    拾煤拾萤拾遗拾才
    拾头拾没拾菜拾摭
    拾渖蒙拾删拾纠拾
    芥拾捡拾俯拾搊拾
    采拾拾踊拾栌掇拾
    剟拾寒拾骨拾剿拾
    缉拾抉拾捃拾决拾
    攈拾筌拾樵拾剽拾
    拾纂拾袭拾投拾物
    拾零拾青撮拾蹈拾
    拾括摭拾缀拾拾发
    收拾探拾拾弄拾紫
    拾翠拾蜯拾级拾翻
    拾掇拾地芥拾翠人拾青紫
    拾唾余拾音器不拾遗拾遗记
    拾牙慧拾菜娘拾漏子拾翠羽
    拾余唾拾人涕唾拾零打短仰拾俯取
    引针拾芥易如拾芥艺海拾贝拾人唾涕
    拾掇无遗拾陈蹈故拾带重还弃琼拾砾
    青紫拾芥路不拾遗不堪收拾抱枝拾叶
    不可收拾拾人牙后拾遗求利拾金不昧
    俯拾地芥俯拾仰取俯拾皆是掇青拾紫
    掇拾章句俯拾青紫俛拾仰取俛拾地芥
    路无拾遗芥拾青紫虎珀拾芥琥珀拾芥
    俯拾即是放羊拾柴钓名拾紫道不拾遗
    道无拾遗补过拾遗补阙拾遗拾人牙慧
    拾翠踏青拾遗补阙拾人唾余易于拾遗
    涂不拾遗仰取俯拾如拾地芥众人拾柴火焰高
    道不拾遗,夜不闭户一人善射,百夫决拾举如鸿毛,取如拾遗收拾余烬,背城借一
    2.奔驰 賓士
    3.标致 寶獅

  2. 这样转换完之后,前往中的目录还是繁体的。请问有办法把这一部分也转换吗?谢谢了

    • wzh 您好。“前往”中的文字是电子书中 .ncx 文件中的文字,不属于电子书的内容部分,所以 Calibre 不会处理。建议您先转换成 azw3 或 ePub 格式,然后手动修改 tox.ncx 文件,复制里面所有的代码,然后找一个简体转繁体网站转换一下,然后再贴回来即可。保存,然后再把修改后的电子书转换成 mobi 格式即可。

    • judypolo 您好。繁体转换简体相对来说比较简单,但是简体转换繁体就很困难了。比如繁体中的“幹活”和“乾燥”中的“幹”和“乾”,简体都是“干”,从繁体转换到简体只需要把两者替换成“干”即可,但是如果想从简体转换成繁体,除非利用各种字词组合的方式匹配,简单的替换达不到预期效果。所以如果您想要看繁体的电子书,建议尽量找原版繁体,如果原版就是简体,也没必要转换成繁体了。

      • 會一讀再讀的書,如果是簡體,我還是會用convertZ轉成繁體,重新排版挑錯,錯誤很少,而且可以自己增加轉換詞句,如果calibre的這個插件,簡轉繁字庫能讀取convertZ的字庫就好了…

  3. 教育部、国家语委搞得,汉字简繁文本智能转换系统,http://jf.cloudtranslation.cc/,这个转换系统不知道能不能用上。