Calibre 使用教程之电子书繁体字转简体字
有没有电子书的简繁体转换方法?如何才能把繁体电子书转换成简体?对于习惯了阅读简体汉字的小伙伴,在遇到繁体版电子书时都会遇到这样的问题,在本文中 Kindle 伴侣就给大家介绍一个比较实用的 Calibre 使用技巧,把电子书中的繁体字转换成你所熟悉的简体字。
一、下载转换规则词库
这里的电子书繁体字转简体字的原理是利用了 Calibre 的“查找与替换”功能,此功能可以在转换电子书的同时,根据提供的“替换规则”实时地对电子书内容进行搜索并替换。这里的“替换规则”由“搜索正则表达式”和“替换文本”组成,当然这些替换规则我们不需要手动一个个去输入,已经有网友提供了比较全面的词库规则,可以直接拿来使用。
这里推荐 HiPDA 论坛的 fengcuo 提供的词库规则。此词库依 Calibre 替换规则对词库进行了校对,增加新字词、繁简对换、修改规则、重排、全词库去重、去繁简同型词组,并修正了由时代进步而呆滞的词组变更。最新版本的词库有 4989 对(含标点)。
由于简繁存在“一简对多繁”和“一繁对多简”,普通的转换可能会出现丢字(如“後来”不转换)、错换(如“著名”转成“着名”,“甚麽”转成“什麽”)和不转换标点符号的问题。有了专门校正过的词库规则就可以很好的避免这些问题,让行文阅读起来更加流畅。
二、繁体转简体操作步骤
这里以胡适等著的《怎样读书》繁体版作为示例演示操作步骤:
- 打开 Calibre,把“怎样读书.epub”[注1]拖放到 Calibre 的书库中;
- 右键点击该电子书,在弹出的菜单中将鼠标移动到“转换书籍 -> 逐个转换”;
- 点击“逐个转换”调出转换窗口后,点击窗口左侧的“查找与替换”转到查找替换界面(下图);
- 在窗口的右侧操作区点击【加载】按钮,选取刚才下载的 .csr 文件;
- 点击【确定】开始转换,等待转换完毕即可得到转换成简体字内容的 mobi 文件[注2]。
繁转简最终效果:
三、自定义转换规则
虽然该词库已经够大,基本囊括了各常见领域专有名词,但是由于汉语也在演变,且有少部分人名(如个别古人名)等专有名词还是需要部分繁体显示的,所以很难 100% 完美。如果转换完后感觉有个别字词没有转换或者转换错误,可以按照下面方法添加自定义转换规则到规则列表中。
在“查找与替换”界面依次操作:
- 在“查找正则表达式”栏目填写目标字词;
- 在“替换文本”栏目填写替换字词;
- 点击【添加】按钮把这条替换规则添加到规则中,点击【保存】。
以上。希望对有需要的小伙伴有所帮助。如果您对原字库规则做了比较多的修正,可以点击这里向原字库规则提供者反馈,帮助他完善,以便造福更多的 Kindler,谢谢。
——————
[注1] 这里只是用 EPUB 格式电子书举例说明,使用其他 AZW、AZW3、MOBI、TXT 等源格式都可以,只要 Calibre 支持此格式的转换。
[注2] 这里只是以转换成 Kindle 支持的 MOBI 格式电子书举例,选择转换成其他 AZW、AZW3 等 Kindle 支持的格式也是可以的。
参考资料:Calibre -繁体转简体批处理-增强扩展词组!
——————
Kindle 电子书简体转繁体请参考《如何利用字体将简体 Kindle 电子书内容转为繁体》。
© 「书伴」原创文章,转载请注明出处及原文链接:https://bookfere.com/post/162.html
“转换电子书格式”相关阅读
- 如何把 KFX 格式转换成 MOBI 等其它电子书格式
- Kindle 漫画制作软件 ChainLP 简明教程
- 乐书:在线 Kindle 电子书制作和转换工具
- KindleGen:亚马逊官方 Kindle 电子书格式转换工具
- 如何直接推送 EPUB 格式电子书到 Kindle 邮箱
- Kindle Comic Converter:最简单的漫画转换工具
- Calibre 使用教程之转换电子书格式
- Calibre 常用命令行工具详解之 ebook-convert
- EasyPub:把 TXT 文档转成带目录的 MOBI 格式
- EpubPress:把打开的多个网页转成一本电子书
- 如何将 AZW3 格式无损转换为 EPUB 格式并保持原有排版
- Calibre使用教程之为电子书添加或修改封面
- Calibre 使用教程之为电子书添加更换字体
- 如何把 Kindle 电子书的横排文字改成竖排
- Kindle Comic Creator:亚马逊官方漫画转换工具
請問改完簡體後,在calibre裡面的書名還是原來的繁體,這樣正常嗎? 謝謝
书名是存放在元数据文件里的,因为这功能不会修改这里面的数据,所以仍保持原样。
宣传下个人维护的Calibre繁体转简体规则吧,正确率提高到了万字错一,都是我自己转换完在Kindle上读的时候发现问题再进行修改的https://github.com/a5566123s/Calibre-BIG5toGBK/
感谢!很好用!
非常感谢,很有帮助
感谢 解决了我的问题
PDF文件转没有变,怎么回事?
本文提供的方法不适用于直接转换 PDF 文件,你需要先将 PDF 转换成文本形式的文件才行。
站长,字库应该更新一下了,之前好像是5900多了。
因为没有 HiPDA 的账号,所以无法访问原帖进行更新,如果你能访问且愿意的话,可以下载下来存到网盘贴到这里,谢谢。
请问一下站长,怎么把kindle电子书里面的简体字转换成繁体字,看一些古籍和佛经时候感觉繁体字更有韵味
可以参考这篇文章《如何利用字体将简体 Kindle 电子书内容转为繁体》。
谢谢,真的很有用。
繁简转换之后书名号括号之类的标点符号有问题怎么办?
海外使用百度云盘有点难。。。我们住在海外怎么办?
已添加“本地下载”。下载服务器在海外,下载应该没问题了。
能不能出个简体转繁体的规则啊?
之前有小伙伴问过这个问题,可点击这里参考那个问题的相关讨论。
非常有用,谢谢站长!
非常感谢,正好用上了
因为Hi!PDA论坛的注册审核原因,无法将bug反馈给原贴主,请有账号的朋友反馈一下:
1. 最大的问题在于“拾”和“十”的简繁转换,导致如下短语出错:
带拾字的词语
拾夺 拾诵 拾尘 拾骨
拾拣 拾芥 招拾 援拾
整拾 拾荒 拾集 诵拾
拾煤 拾萤 拾遗 拾才
拾头 拾没 拾菜 拾摭
拾渖 蒙拾 删拾 纠拾
芥拾 捡拾 俯拾 搊拾
采拾 拾踊 拾栌 掇拾
剟拾 寒拾 骨拾 剿拾
缉拾 抉拾 捃拾 决拾
攈拾 筌拾 樵拾 剽拾
拾纂 拾袭 拾投 拾物
拾零 拾青 撮拾 蹈拾
拾括 摭拾 缀拾 拾发
收拾 探拾 拾弄 拾紫
拾翠 拾蜯 拾级 拾翻
拾掇 拾地芥 拾翠人 拾青紫
拾唾余 拾音器 不拾遗 拾遗记
拾牙慧 拾菜娘 拾漏子 拾翠羽
拾余唾 拾人涕唾 拾零打短 仰拾俯取
引针拾芥 易如拾芥 艺海拾贝 拾人唾涕
拾掇无遗 拾陈蹈故 拾带重还 弃琼拾砾
青紫拾芥 路不拾遗 不堪收拾 抱枝拾叶
不可收拾 拾人牙后 拾遗求利 拾金不昧
俯拾地芥 俯拾仰取 俯拾皆是 掇青拾紫
掇拾章句 俯拾青紫 俛拾仰取 俛拾地芥
路无拾遗 芥拾青紫 虎珀拾芥 琥珀拾芥
俯拾即是 放羊拾柴 钓名拾紫 道不拾遗
道无拾遗 补过拾遗 补阙拾遗 拾人牙慧
拾翠踏青 拾遗补阙 拾人唾余 易于拾遗
涂不拾遗 仰取俯拾 如拾地芥 众人拾柴火焰高
道不拾遗,夜不闭户 一人善射,百夫决拾 举如鸿毛,取如拾遗 收拾余烬,背城借一
2.奔驰 賓士
3.标致 寶獅
这样转换完之后,前往中的目录还是繁体的。请问有办法把这一部分也转换吗?谢谢了
wzh 您好。“前往”中的文字是电子书中 .ncx 文件中的文字,不属于电子书的内容部分,所以 Calibre 不会处理。建议您先转换成 azw3 或 ePub 格式,然后手动修改 tox.ncx 文件,复制里面所有的代码,然后找一个简体转繁体网站转换一下,然后再贴回来即可。保存,然后再把修改后的电子书转换成 mobi 格式即可。
能否提供简转繁的呢?谢谢!
judypolo 您好。繁体转换简体相对来说比较简单,但是简体转换繁体就很困难了。比如繁体中的“幹活”和“乾燥”中的“幹”和“乾”,简体都是“干”,从繁体转换到简体只需要把两者替换成“干”即可,但是如果想从简体转换成繁体,除非利用各种字词组合的方式匹配,简单的替换达不到预期效果。所以如果您想要看繁体的电子书,建议尽量找原版繁体,如果原版就是简体,也没必要转换成繁体了。
會一讀再讀的書,如果是簡體,我還是會用convertZ轉成繁體,重新排版挑錯,錯誤很少,而且可以自己增加轉換詞句,如果calibre的這個插件,簡轉繁字庫能讀取convertZ的字庫就好了…
教育部、国家语委搞得,汉字简繁文本智能转换系统,http://jf.cloudtranslation.cc/,这个转换系统不知道能不能用上。