Ebook Translator:用 Calibre 翻译多语言多格式的电子书

- 修复不能正确分割译文中的 ID 标记的错误;
- 修复文本流响应未完成读取的处理错误;
- 修复自动更换 API 密钥功能的错误;
- 修复开启仅保留译文后没删除原文的问题;
- 修复没有删除注音回退括号元素的错误;
- 修复部分翻译引擎破坏词汇表插入标记的问题;
- 修复无法正确过滤掉空内容的错误;
- 优化了缓存和词汇表功能。
Ebook Translator 是书伴开发的一款 Calibre 插件,可以将不同格式不同语言的电子书翻译成指定语言(原文译文对照)指定格式的电子书,支持 Google、ChatGPT 和 DeepL 翻译引擎。
在日常的生活、工作或学习中,如果在阅读或翻译外文电子书的过程中需要频繁使用翻译软件,在内容和翻译软件之间来回切换,可能会成为一件颇为痛苦的事。Ebook Translator 插件借力 Calibre 对电子书的强大处理功能和翻译引擎对多种语言的翻译支持,可以轻松将译文添加到原文段落之后,如下图那样形成双语对照,方便辅助对原文的理解或作为译制材料时的参考。
▲ Ebook Translator 插件翻译的电子书效果
借助 Calibre 对多种电子书格式的灵活支持,进行翻译时,你可以自由地选择输入输出格式,比如把 TXT 翻译成为 TXT 或 EPUB,把 PDF 翻译成 PDF 或 DOCX。
Ebook Translator 插件源代码使用 GPL v3 许可证。插件项目托管在 GitHub 上。
一、功能简介
★ Ebook Translator 插件主要包含以下功能:
- 支持“批量模式”和“高级模式”两种翻译模式,应用于不同使用场景
- 支持所选翻译引擎所支持的语言(如 Google 翻译支持 134 种)
- 支持多种翻译引擎,包括 Google 翻译、ChatGPT 以及 DeepL
- 支持自定义翻译引擎(支持解析 JSON 和 XML 格式响应)
- 支持所有 Calibre 所支持的电子书格式(输入格式 48 种,输出格式 20 种)
- 支持批量翻译电子书,每本书的翻译过程同时进行互不影响
- 支持缓存翻译内容,在请求失败或网络中断后无需重新翻译
- 提供大量自定义设置,如将翻译的电子书存到 Calibre 书库或指定位置
★ Ebook Translator 插件支持翻译的语言:
- Google 翻译支持的语言列表
- DeepL 翻译支持的语言列表
- ChatGPT 具体支持语言不详
- 有道翻译支持的语言列表
- 百度翻译支持的语言列表
★ Ebook Translator 插件支持的输入格式:
EPUB, AZW3, AZW4, MOBI, PDF, DOCX, TXT, MARKDOWN, RTF, RECIPE, HTML, HTM, XHTML, XHTM, TXTZ, CB7, ODT, RAR, FBZ, CBC, SHTM, TEXT, SHTML, POBI, UPDB, OPF, TCR, PML, PDB, CHM, SNB, LRF, LIT, RB, DOWNLOADED_RECIPE, CBR, DJV, DJVU, MD, AZW, TEXTILE, DOCM, HTMLZ, PMLZ, CBZ, ZIP, PRC, FB2
★ Ebook Translator 插件支持的输出格式:
EPUB, AZW3, MOBI, KFX, PDF, DOCX, TXT, RTF, OEB, TCR, PDB, SNB, LRF, TXTZ, LIT, RB, HTMLZ, PMLZ, ZIP, FB2
二、安装插件
首先确保你的操作系统已经安装了 Calibre,然后通过一下任意方式安装本插件:
【方法一】通过 Calibre 安装
- 打开 Calibre 并依次点击其菜单【 首选项… → 插件 → 获取新的插件 】;
- 在插件列表中选中 Ebook Translator 然后点击 【 安装 】 按钮(请留意,首次安装此插件时,要选择把图标显示在主工具栏上);
- 最后关闭并重新打开 Calibre 即可正常使用。
【方法二】通过插件文件安装
- Ebook Translator 插件下载:GitHub下载 | 百度网盘 | 本地下载 | Google Drive
NAME: Ebook-Translator-Calibre-Plugin_v2.0.1.zip
MD5: acf8761e39ec60ce910bbc547ba92e13
SHA1: bbbb9aea308e0e7f50b9a1716134a1b1e028e5da
- 首先在通过以上链接下载插件文件;
- 然后打开 Calibre 并依次点击其菜单【首选项 → 插件 → 从文件加载插件】;
- 在弹出的对话框中选择下载的扩展名为 .zip 的插件文件完成安装(请留意,首次安装此插件时,要选择把图标显示在主工具栏上);
- 最后关闭并重新打开 Calibre 即可正常使用。
如果你想安装最新的插件,可以运行以下命令从 GitHub 仓库中下载最新的插件文件:
git clone https://github.com/bookfere/Ebook-Translator-Calibre-Plugin.git
cd Ebook-Translator-Calibre-Plugin
git archive --format zip --output ../Ebook-Translator-Calibre-Plugin.zip master
如果安装插件后,插件图标未出现在 Calibre 的主工具栏上,可以依次点击 Calibre 的菜单【首选项 → 工具与菜单】,在弹出的对话框中点击下拉菜单并选择“主工具栏”,然后在左栏找到并选中插件图标,点击中间的右箭头按钮【>】将其添加到右栏,最后点击【应用】按钮即可。
三、使用方法
Ebook Translator 提供了两种翻译模式,在开启缓存状态下两者共享同一缓存数据。
高级模式
- 在 Calibre 书库中选中要推送的电子书,点击 Calibre 主工具栏上的【翻译书籍】图标按钮,或点击图标下拉菜单选择【高级模式】;
- 在弹出的提示框点击选择“高级模式”(首次打开);
- 选择“输入格式”和“输出格式”,点击【开始】进入“高级模式”翻译主界面;
- 点击【删除】按钮删除需要忽略翻译的选中段落(可选);
- 通过以下两种方式进行翻译:
- 点击【翻译所选】按钮翻译选中的段落
- 点击【翻译全部】按钮翻译全部电子书内容
- 翻译完成后,在右方“校对”区域,通过编辑下方文本并点击【保存】,可以更改翻译结果;
- 点击【输出】按钮,存储翻译完成后的电子书。输出任务将被推送添加到 Calibre 的任务队列。
批量模式
- 在 Calibre 书库中选中要推送的电子书,点击 Calibre 主工具栏上的【翻译书籍】图标按钮,或点击图标下拉菜单选择【批量模式】;
- 在弹出的提示框点击选择“批量模式”(首次打开);
- 进入插件主界面,在这里你可以修改“书名”(作为保存文件时使用的文件名),分别为每一本书选择“输入格式”、“输出格式”、“来源语言”(一般情况下“自动探测”即可满足需求)、“目标语言”(默认使用 Calibre 界面当前所用的语言);
- 点击下方的【翻译】按钮即可开始翻译。
插件会将每本电子书的翻译任务推送添加到 Calibre 的任务队列,你可以通过点击 Calibre 右下角的【任务】查看推送详情,双击任务条目可以进入日志实时查看正在翻译的内容。
三、插件设置
▲ Ebook Translator 通用设置
▲ Ebook Translator 引擎设置
▲ Ebook Translator 内容设置
有关设置内容的详细说明请查阅 Ebook Translator 项目的 Wiki 页面。
https://github.com/bookfere/Ebook-Translator-Calibre-Plugin/wiki/简体中文#设置说明
五、注意事项
开发 Ebook Translator 插件测试用的 Calibre 版本是 3.48 和最新版版本,因此理论上插件在 3.x 到 6.x 版本的 Calibre 中都能正常使用,但是如果版本低于 3.x,可能无法正常使用。
尽管 Ebook Translator 插件在发布前尽可能做了可用性测试,但是限于用来测试的电子书数量,仍无法保证在任何情况下运行结果不会出现问题。如果你在使用插件的过程中遇到了问题,欢迎留言详述问题。如果有好的建议或想要贡献代码,也欢迎访问 GitHub 上的插件项目。
六、常见问题
1、翻译文件丢失
有些用户反馈翻译完成后无法打开文件,此问题通常发生在 Windows 系统上。在 Windows 系统中,有一个功能叫做 “存储感知”,它会自动清理长时间运行程序的临时文件。你可以尝试关掉此功能,或通过 Calibre 的环境变量 CALIBRE_TEMP_DIR
为其重新指定一个文件夹。(credit)
2、翻译速度太慢
插件自 1.3.7 版本开始支持并发请求,你可以衡量自己的需要和翻译引擎的限制在设置中设定并发请求数量。此功能仅支持 Calibre 5.0 或更高版本,如果低于 5.0 需要升级 Calibre 版本。
3、合并翻译效果
在使用 ChatGPT 时合并翻译功能表现较差,这是因为插件会在合并后的文本中添加标记,由于无法保证 ChatGPT 翻译这些文本后仍会保留这些标记,因此无法保证最终的翻译效果。因此,如果要使用的 ChatGPT 翻译电子书,不建议开启合并翻译功能。
七、更新日志:
2023.06.10 / v2.0.1
- 修复不能正确分割译文中的 ID 标记的错误;
- 修复文本流响应未完成读取的处理错误;
- 修复自动更换 API 密钥功能的错误;
- 修复开启仅保留译文后没删除原文的问题;
- 修复没有删除注音回退括号元素的错误;
- 修复部分翻译引擎破坏词汇表插入标记的问题;
- 修复无法正确过滤掉空内容的错误;
- 优化了缓存和词汇表功能。
2023.06.06 / v2.0.0
- 添加“高级模式”,可以更加细颗粒度控制翻译内容;
- 为 ChatGPT 添加更多选项,如端点、采样、模型;
- 为多有内置翻译引擎添加多 API 密钥的支持;
- 添加“忽略元素”功能,用来排除不需要翻译的元素;
- 增强缓存功能,包含了更多内容供用户检查;
- 添加偏好输入/输出格式和偏好来源于言选项;
- 为内置的翻译引擎添加了 Azure ChatGPT;
- 添加了“偏好模式”选项,用于点击图标按钮设置;
- 为“HTTP 请求”设置添加了“超时”选项;
- 优化了 ChatGPT 提示词,以求更精确的翻译;
- 修复没能正确过滤段落的错误;
- 优化用户体验、增强功能以及其它错误修复。
2023.05.12 / v1.3.8
- 修复无法保存“忽略段落”规则的错误;
- 修复导致某些段落被忽略翻译的错误;
- 修复某些内容导致插件中断工作的错误。
2023.05.11 / v1.3.7
- 支持并发请求(仅 Calibre 5.0 及更高版本可用);
- 为“忽略段落”功能添加过滤范围选项;
- 支持在翻译过程中忽略 pre/code 元素。
2023.05.08 / v1.3.6
- 删除旧的元素抽取方式以避免遗漏翻译;
- 限制文件名为 200 个字符以避免保存时出错;
- 修复插件从低版本升级到低版本时的错误;
- 使插件兼容低版本的 Calibre。
2023.05.06 / v1.3.5
- 自定义翻译引擎已支持“合并翻译”;
- 为 ChatGPT 和自定义翻译引擎优化“合并翻译”功能;
- 为如抽取元素等关键功能添加测试用例。
2023.05.05 / v1.3.4
- 修复了开启“合并翻译”后 ChatGPT 无法保留标记的错误。
2023.05.04 / v1.3.3
- 添加新翻译引擎:Google (Basic)、Google (Advanced);
- 将 Google (Free) 的请求方法改为 GET 以避免“Too Many Requests”错误;
- 在日志中添加重试请求时的时间戳。
2023.05.01 / v1.3.2
- 修复影响插件可用性与处理图片相关的错误;
- 修复导致翻译引擎设置显示错误名称的错误;
- 修复无法为代理主机输入 URI 协议的错误。
2023.04.29 / v1.3.1
- 移除了对百度翻译密钥的输入限制。
2023.04.28 / v1.3.0
- 添加了“合并翻译(测试版)”功能;
- 支持为目标语言设置偏好语言;
- 支持自定词汇表以确保翻译更加精准;
- 添加免费版本的 DeepL 翻译引擎;
- 为 ChatGPT 添加服务器发送事件(SSE)支持。
2023.04.19 / v1.2.2
- 优化自定义翻译引擎功能。
2023.04.18 / v1.2.1
- 修复导致 DeepL 无法正常运行的错误。
2023.04.17 / v1.2.0
- 添加了自定义翻译引擎功能
- 添加了翻译引擎测试功能
- 添加了显示某些翻译引擎使用余量功能
2023.04.08 / v1.1.0
- 可通过“内容”面板调整译文位置
- 添加过关键字或正则表达式排除不需翻译内容
- 添加百度和有道两款翻译引擎
- 将已翻译电子书作为新项目加入书库
- 添加为更改译文文本颜色的功能
- 添加自定义ChatGPT提示词功能
- 忽略对注音(如日语注音)的翻译
- 界面语言添加西班牙语
- 为日志添加有助于排插错误的诊断信息
- 为译文元素标签添加对应的lang属性
- 修复切换Calibre界面语言插件图标消失的错误
- 改进原文的提取功能
2023.03.29 / v1.0.2
- 修复了 MOBI 转 MOBI 时翻译内容丢失的问题
- 优化请求失败后重试时的时间间隔
- 输出文件扩展名改为小写字母
2023.03.29 / v1.0.1
- 修复点击完成提示框上的打开按钮出错的问题
2023.03.28 / v1.0.0
- 首次发布
© 「书伴」原创文章,转载请注明出处及原文链接:https://bookfere.com/post/1057.html
延伸阅读
- Ebook Translator:用 Calibre 翻译多语言多格式的电子书
- 只为纯粹阅读体验:亚马逊 kindle 产品经理专访
- 第二代 Kindle Paperwhite 对比第一代的区别
- Calibre 发布 3.0 版本(附常用功能梳理)
- Paperwhite 和 Voyage 有何不同,选哪个更好?
- 体验难比 Kindle,当当国文电子阅读器遇冷
- Sherry推荐图书(二十)—— 有趣的书
- [每周一书] 先看《火星救援》原著的三个理由
- 如何把 Kindle 电子书的横排文字改成竖排
- [2018.11.09] Kindle Paperwhite 4 固件升级至 5.10.1.2
- 读书改面相:读书有助于精神气质的提升
- [每周一书]《明智行动的艺术》避开 52 种行为错误
- 亚马逊 Kindle 将启用新款无衬线字体 Ember
- 下一代 Kindle 被命名为 Kindle Oasis 或可防水
- 我们真需要用三分之一生命读书吗?
- [每周一书]《美妙的新世界》机械文明下的未来社会
你好,为什么翻译速度很慢,有没有办法解决呢??
对请求频率限制较低的翻译引擎(如 Google 翻译),可以在设置中加大并发请求数量(如 100)以加快翻译速度。对请求频率限制较高的翻译引擎(如免费版的 ChatGPT),则不要使用并发请求,还要设定一个合适的请求时间间隔,以防 API 拒绝服务。
calibre, version 6.14.0
错误: 转换失败: 转换失败:
许多较老的电子书阅读器无法显示内部单个文件超过一定大小的EPUB文件。
因此,当转换为EPUB时,calibre 会自动尝试将EPUB内部文件拆分成多个较小的文件。对于一些大的无法拆分文本块的文件,此拆分无效。
你可以通过在转换对话框中增加EPUB输出下的最大拆分大小或通过在转换对话框中打开智能处理来解决这个问题。请注意,如果你的最大拆分大小过大,你的电子书阅读器可能会遇到EPUB的问题。
译完之后转换失败,该怎么办呢?
用的是什么翻译引擎,是否使用了合并翻译功能?
谷歌,用了合并翻译
用DeepL(Free)英译中,翻译词汇表皆没替换。该怎么做呢?勾选并保存了。
请问出现这种问题是为什么,刚开始就报错。
Python function terminated unexpectedly
unable to open database file (Error Code: 1)
Traceback (most recent call last):
File “site.py”, line 114, in main
File “site.py”, line 88, in run_entry_point
File “site-packages\calibre\utils\ipc\worker.py”, line 209, in main
File “site-packages\calibre\utils\ipc\worker.py”, line 146, in arbitrary_n
File “calibre_plugins.ebook_translator.convertion”, line 90, in convert_book
File “calibre_plugins.ebook_translator.cache”, line 15, in __init__
sqlite3.OperationalError: unable to open database file
请问,如何设置只翻译文字内容和正常的符号。
其他内容(如奇怪的特殊符号这些),全部都不翻译出来,自动忽略删掉。
您好,我出现了这种情况,翻译结果如下:
太多的 {{}} 符号,影响观看体验了,需要怎么调整呢?
{{id_234}} 参考文献 {{id_235}} Alessi, S., & Dwyer, A. (2008)。阅读前和阅读期间的词汇帮助。阅读外语,20(2),246-263。 {{id_236}} Bell, T. (2001)。泛读:速度和理解。阅读矩阵,1(1), 1– 13。{{id_237}} 在速读课程中提高阅读速度 19 {{id_238}} Bismoko, J., & Nation, I. S. P. (1972)。阅读速度和迁移训练。 Publikasi Ilmu Keguruan Sastra Seni,2(2),3-5。 {{id_239}} Bowey, J. (2005)。预测学习阅读的个体差异。在 M. Snowling & C. Hulme(编辑),阅读科学(第 155-172 页)中。马萨诸塞州马尔登:布莱克威尔。 {{id_240}} Carver, R. P. (1992)。阅读率:理论、研究和实际意义。阅读杂志,36(2),{{id_241}}84-95。 {{id_242}} 张,A. C. S. (2010)。定时阅读活动对 EFL 学习者的影响:速度、理解和感知。阅读外语,22(2),284-303。 {{id_243}} Chung, M., & Nation, P. (2006)。速读课程的效果。英语教学,64(4), 181–204。 Cramer, S. (1975)。提高英文或本国语言的阅读速度? RELC 期刊,6, 19–25。 {{id_244}} Daneman, M. & Carpenter, P. A. (1980)。工作记忆和阅读的个体差异。语言学习和语言行为杂志,19,450-466。 {{id_245}} Das, J. P., & Mishra, R. K. (1991)。记忆跨度、命名时间、语速和阅读能力之间的关系。实验教育杂志,59(2),129–139。{{id_246}} Fortkamp, M. B. M. (1999)。工作记忆容量和 L2 语音生成的各个方面。沟通与认知, 32, 259–296。 {{id_247}} Fry, E. (1967)。阅读更快。剑桥:剑桥大学出版社。 {{id_248}} Fuchs, L., Fuchs, D., Hosp, M., & Jenkins, J. (2001)。口语阅读流利度作为阅读能力的指标:理论、实证和历史分析。阅读和写作的科学研究,5,{{id_249}} 239–256。
0}} Harrington, M., & Sawyer, M. (1992)。 L2 工作记忆能力和 L2 阅读能力。第二{{id_251}}语言习得研究,14, 25–38。 {{id_252}} Harris, D. (1970)。实验组执行记忆跨度测试的报告。 TESOL 季刊,4(3),{{id_253}} 203–213。 {{id_254}} 亨
这是合并段落时插入的标记,会出现在日志中,但是应该不会出现在最终的电子书中的。你指的是日志中的观感吗?
日志中的观感倒没关系,主要是有时候会导入kindle,有时候直接在calibr软件上观看,有时候会在wps打开观看。
上述情况不知道是在calibr软件还是wps软件显示的结果。
但不是指日志而已。
你指的是最终生成的电子书含有这些标记吗?
你好,请问合并翻译与正常翻译在翻译质量上有区别吗,合并翻译是否会根据上下文进行理解性的翻译
合并翻译含有更多的上下文,理论上质量会更好一些,但是还是建议自己对比一下。
经过测试:DeepL免费和Dpeel API FREE的翻译效果和速度相差无几,API PRO没有办法测试.
将书籍转换为docx后,Dpeel pro上传文档翻译的效果比ebook translator的效果还差一些,出现吞字母的情况,,也可能和我的书籍有关系.
你好,请问在书籍完成后发生以下错误OSError: [Errno 28] No space left on device是怎么回事
如果磁盘空间充足,有可能是临时文件夹中的临时文件数量过多的原因。可以尝试按 WIN + R 键打开“运行”输入 %temp% 后回车,删除一些临时文件再试试看。
你好,我在用deeplfree翻译时总会报错,谷歌就不会
DeepL (Free) 不稳定,除非你能忍受较大请求间隔,否则建议使用 Google (Free)。
我是路由器代理的,比谷歌慢一点,但是也就隔一两个小时才报错
你好,可以解释一下什么是路由器代理吗,我查了一下没看懂
就是路由器就挂了梯子挂,稳定,不掉
你好,我在使用翻译词汇表的时候,无论用哪种格式,我的翻译都不会纠正。
White
白方
Black
黑方
我都是每一组下面空一行,但是翻译出来还是没有改变,white翻译成怀特。是我的操作用问题,还是?
使用的是哪种翻译引擎?
由于使用chatGPT速度太慢了所以用了,谷歌和DeepL的非API方式.
输入格式是EPUB,输出任意格式同样如此.
来源语言选择自动检测和英语也一样
没有勾选合并翻译,且没有开启忽略段落.
翻译词汇表在F盘根目录,F:/翻译.txt
其余设置均为默认
| Calibre Version: 6.17.0
| Plugin Version: v1.3.8
| Translate Engine: DeepL(Free)
| Source Language: 自动探测
| Target Language: Chinese (simplified)
| Input Path: E:\书库\Unknown\The Unstoppable American – Jan Timm (1478)\The Unstoppable American – Jan – Unknown.epub
| Output Path: F:/suc\The Unstoppable American – Jan Timman (Chinese (simplified)).docx
==============================
翻译词汇表前面的“开启”复选框勾选了吗?
开启了,并且保存了
向您请教:
1、google(Free)与Chat Gpt 3.5,翻译准确度谁会更高呢?
2、我设置的合并翻译字符数量不超过多少,在google(Free)翻译出的结果比较稳定呢?
3、忽略段落的功能能否展开讲讲,以程序小白的口头语言解释一下,还是不了解功能的内容。
1、精准度不好评价,我的感觉这更多是个偏好问题。如果不是做翻译工作而只是用来辅助理解原文,它们之间的差异应该是可以忽略的。你可以自己对比一下翻译结果再做选择。不过可以肯定的是,Google (Free) 更快一些 :D
2、目前对 Google (Free) 的请求使用的是 GET 方法,这个 API 对请求的长度有限制,最好不要超过通常网页浏览器对 GET 方法的字符数限制(即 2083),加上合并段落会向内容插入标记这也会占用一些字符数,使用默认 2000 个字符是比较理想的。这个 API 也支持 POST 方法,曾经为了增加请求字符数尝试过,但是因为会出现“Too Many Request”的问题就又改回来了。如果你使用的是付费翻译引擎,则都会使用 POST 方法,字符数限制问题几乎可以忽略。
3、忽略段落指的是按照设定的规则忽略插件已抽出的内容。此功能的工作方式在项目 Issue #41 中有所提及。这里再补充一个例子解释一下。比如插件在翻译电子书时抽出了以下元素:
如果你选择的是文本范围,那么设定的规则就会针对元素中的文本内容进行匹配。比如我设定的一条规则是
span
,那么含有下面这个内容的段落就会被忽略:如果你选择是 HTML 元素范围,那么设定的规则就会对整个 HTML 元素进行匹配。比如我设定的一条规则是
class="test2"
或<span>span</span>
,那么下面这个段落就会被忽略:不过正如在项目 Issue #41 所解释的那样,目前这个功能有个缺点,就是插件抽出的元素用户无法控制。后面的版本会推出忽略元素功能,可以在插件抽取元素过程中控制忽略哪些元素不需要翻译。比如我想忽略整个
table
元素,只需要通过指定一个元素名table
就可以忽略整个表格,而不是写多条规则忽略插件已抽出的td
或td
元素中的span
元素。另外,插件正在开发一个可以更精细的控制翻译内容的“高级翻译”功能,会在界面上将这些不太直观的功能可视化。
太感谢您的耐心与细致的解答了,谢谢。
有百度翻译的api,但没有网络代理,设置为百度后依旧使用Google(Free),如何解决🥺
选择百度翻译之后点击【保存】按钮了吗?
原来在下面有保存,打扰了😂
哇,这个新版本厉害了,速度真的显著提升~棒!
后期版本有可能增加回译功能吗?(通过中文再翻译回英文,以确定其准确性,不知如何表达。。)
现在的速度已经很好了,翻译的准确率是否会更加优化。
不知道是不是这一种。→https://blog.csdn.net/dongrixinyu/article/details/108660386
可以理解为加一个选项,控制(英译中,中译英,英译中)这个过程的次数吗?
回译我没太弄懂。
但是不知道能否使用这个策略,以增加翻译准确度:
调用多个主流的翻译引擎,同时翻译,然后系统自动选取“相同率”最高的那条作为翻译结果。
举例说明:A代表相同部分,B代表不同部分
英文翻译
谷歌:AAAAAAAAAA
百度:AAAAAAAAAA
微软:AAAAAAAAAA
有道:AAAAAAAABA
上面这种情况,那么就把微软给删除
谷歌:AAAAABAAAA
百度:ABABABABAB
微软:AABABAABAA
有道:AAAABAABAA
这种情况,就只留下谷歌翻译
意思就是:
设定优先级,保留相同率最高的那条翻译,如出现优先级无法辨别,则引用主流的翻译引擎
大概是这个意思,不知道现不现实。
这个网页版翻译引擎:
https://languagex.com
里面就有可以调用多个翻译引擎的,输入一句中文,可以调动谷歌、百度、微软、deepl给出翻译,然后选出叠重率最高的那条作为最终翻译结果,想法大致就是这样子。
看起来很复杂的样子。今后有机会再研究,或者看是否有人贡献代码。
你好,看了你的第一个例子,只有有道出现一个B,为啥不是把有道删除
您好,请问翻译出来带有一些特殊符号,是哪里出了问题了吗?
英文的PDF格式翻译成中文的mobi形式
出现例如像:
翻译出来的文件有一些特殊符号:
{{ }}、☑☑☑☑(里面没有打勾),
像出现这些奇怪的符号,是哪里出了问题了吗,需要如何解决
这是在 OCR 后出现的特殊字符吗?
请教一下您:
如果我的书籍是PDF,但是PDF是图片类而非文字类
我有什么办法把PDF先变成文字类呢?
需要使用 ABBYY 之类的 OCR 工具转换。