Ebook Translator:用 Calibre 翻译多格式双语对照电子书

延伸阅读

给这篇文章写一条留言

提示:带 * 标记的是必填项。您填写的邮箱地址将会被保密。首次留言将会在通过人工审核后显示。如果是提出问题,请务必提供尽可能多信息,这有助于他人更好地理解你所提出的问题。

小伙伴们写下了 290 条留言

    • 对请求频率限制较低的翻译引擎(如 Google 翻译),可以在设置中加大并发请求数量(如 100)以加快翻译速度。对请求频率限制较高的翻译引擎(如免费版的 ChatGPT),则不要使用并发请求,还要设定一个合适的请求时间间隔,以防 API 拒绝服务。

  1. calibre, version 6.14.0
    错误: 转换失败: 转换失败:
    许多较老的电子书阅读器无法显示内部单个文件超过一定大小的EPUB文件。
    因此,当转换为EPUB时,calibre 会自动尝试将EPUB内部文件拆分成多个较小的文件。对于一些大的无法拆分文本块的文件,此拆分无效。
    你可以通过在转换对话框中增加EPUB输出下的最大拆分大小或通过在转换对话框中打开智能处理来解决这个问题。请注意,如果你的最大拆分大小过大,你的电子书阅读器可能会遇到EPUB的问题。

  2. 用DeepL(Free)英译中,翻译词汇表皆没替换。该怎么做呢?勾选并保存了。

  3. 请问出现这种问题是为什么,刚开始就报错。
    Python function terminated unexpectedly
    unable to open database file (Error Code: 1)
    Traceback (most recent call last):
    File “site.py”, line 114, in main
    File “site.py”, line 88, in run_entry_point
    File “site-packages\calibre\utils\ipc\worker.py”, line 209, in main
    File “site-packages\calibre\utils\ipc\worker.py”, line 146, in arbitrary_n
    File “calibre_plugins.ebook_translator.convertion”, line 90, in convert_book
    File “calibre_plugins.ebook_translator.cache”, line 15, in __init__
    sqlite3.OperationalError: unable to open database file

  4. 请问,如何设置只翻译文字内容和正常的符号。

    其他内容(如奇怪的特殊符号这些),全部都不翻译出来,自动忽略删掉。

  5. 您好,我出现了这种情况,翻译结果如下:

    太多的 {{}} 符号,影响观看体验了,需要怎么调整呢?

    {{id_234}} 参考文献 {{id_235}} Alessi, S., & Dwyer, A. (2008)。阅读前和阅读期间的词汇帮助。阅读外语,20(2),246-263。 {{id_236}} Bell, T. (2001)。泛读:速度和理解。阅读矩阵,1(1), 1– 13。{{id_237}} 在速读课程中提高阅读速度 19 {{id_238}} Bismoko, J., & Nation, I. S. P. (1972)。阅读速度和迁移训练。 Publikasi Ilmu Keguruan Sastra Seni,2(2),3-5。 {{id_239}} Bowey, J. (2005)。预测学习阅读的个体差异。在 M. Snowling & C. Hulme(编辑),阅读科学(第 155-172 页)中。马萨诸塞州马尔登:布莱克威尔。 {{id_240}} Carver, R. P. (1992)。阅读率:理论、研究和实际意义。阅读杂志,36(2),{{id_241}}84-95。 {{id_242}} 张,A. C. S. (2010)。定时阅读活动对 EFL 学习者的影响:速度、理解和感知。阅读外语,22(2),284-303。 {{id_243}} Chung, M., & Nation, P. (2006)。速读课程的效果。英语教学,64(4), 181–204。 Cramer, S. (1975)。提高英文或本国语言的阅读速度? RELC 期刊,6, 19–25。 {{id_244}} Daneman, M. & Carpenter, P. A. (1980)。工作记忆和阅读的个体差异。语言学习和语言行为杂志,19,450-466。 {{id_245}} Das, J. P., & Mishra, R. K. (1991)。记忆跨度、命名时间、语速和阅读能力之间的关系。实验教育杂志,59(2),129–139。{{id_246}} Fortkamp, M. B. M. (1999)。工作记忆容量和 L2 语音生成的各个方面。沟通与认知, 32, 259–296。 {{id_247}} Fry, E. (1967)。阅读更快。剑桥:剑桥大学出版社。 {{id_248}} Fuchs, L., Fuchs, D., Hosp, M., & Jenkins, J. (2001)。口语阅读流利度作为阅读能力的指标:理论、实证和历史分析。阅读和写作的科学研究,5,{{id_249}} 239–256。
    0}} Harrington, M., & Sawyer, M. (1992)。 L2 工作记忆能力和 L2 阅读能力。第二{{id_251}}语言习得研究,14, 25–38。 {{id_252}} Harris, D. (1970)。实验组执行记忆跨度测试的报告。 TESOL 季刊,4(3),{{id_253}} 203–213。 {{id_254}} 亨

    • 这是合并段落时插入的标记,会出现在日志中,但是应该不会出现在最终的电子书中的。你指的是日志中的观感吗?

      • 日志中的观感倒没关系,主要是有时候会导入kindle,有时候直接在calibr软件上观看,有时候会在wps打开观看。

        上述情况不知道是在calibr软件还是wps软件显示的结果。

        但不是指日志而已。

  6. 你好,请问合并翻译与正常翻译在翻译质量上有区别吗,合并翻译是否会根据上下文进行理解性的翻译

  7. 经过测试:DeepL免费和Dpeel API FREE的翻译效果和速度相差无几,API PRO没有办法测试.
    将书籍转换为docx后,Dpeel pro上传文档翻译的效果比ebook translator的效果还差一些,出现吞字母的情况,,也可能和我的书籍有关系.

  8. 你好,请问在书籍完成后发生以下错误OSError: [Errno 28] No space left on device是怎么回事

    • 如果磁盘空间充足,有可能是临时文件夹中的临时文件数量过多的原因。可以尝试按 WIN + R 键打开“运行”输入 %temp% 后回车,删除一些临时文件再试试看。

  9. 你好,我在使用翻译词汇表的时候,无论用哪种格式,我的翻译都不会纠正。
    White
    白方

    Black
    黑方

    我都是每一组下面空一行,但是翻译出来还是没有改变,white翻译成怀特。是我的操作用问题,还是?

      • 由于使用chatGPT速度太慢了所以用了,谷歌和DeepL的非API方式.
        输入格式是EPUB,输出任意格式同样如此.
        来源语言选择自动检测和英语也一样
        没有勾选合并翻译,且没有开启忽略段落.
        翻译词汇表在F盘根目录,F:/翻译.txt
        其余设置均为默认

      • | Calibre Version: 6.17.0
        | Plugin Version: v1.3.8
        | Translate Engine: DeepL(Free)
        | Source Language: 自动探测
        | Target Language: Chinese (simplified)
        | Input Path: E:\书库\Unknown\The Unstoppable American – Jan Timm (1478)\The Unstoppable American – Jan – Unknown.epub
        | Output Path: F:/suc\The Unstoppable American – Jan Timman (Chinese (simplified)).docx
        ==============================

  10. 向您请教:

    1、google(Free)与Chat Gpt 3.5,翻译准确度谁会更高呢?

    2、我设置的合并翻译字符数量不超过多少,在google(Free)翻译出的结果比较稳定呢?

    3、忽略段落的功能能否展开讲讲,以程序小白的口头语言解释一下,还是不了解功能的内容。

    • 1、精准度不好评价,我的感觉这更多是个偏好问题。如果不是做翻译工作而只是用来辅助理解原文,它们之间的差异应该是可以忽略的。你可以自己对比一下翻译结果再做选择。不过可以肯定的是,Google (Free) 更快一些 :D
      2、目前对 Google (Free) 的请求使用的是 GET 方法,这个 API 对请求的长度有限制,最好不要超过通常网页浏览器对 GET 方法的字符数限制(即 2083),加上合并段落会向内容插入标记这也会占用一些字符数,使用默认 2000 个字符是比较理想的。这个 API 也支持 POST 方法,曾经为了增加请求字符数尝试过,但是因为会出现“Too Many Request”的问题就又改回来了。如果你使用的是付费翻译引擎,则都会使用 POST 方法,字符数限制问题几乎可以忽略。
      3、忽略段落指的是按照设定的规则忽略插件已抽出的内容。此功能的工作方式在项目 Issue #41 中有所提及。这里再补充一个例子解释一下。比如插件在翻译电子书时抽出了以下元素:

      <p class="test">Some text.</p class="test1">
      <p class="test2">Some text contains <span>span</span> element.</p>
      

      如果你选择的是文本范围,那么设定的规则就会针对元素中的文本内容进行匹配。比如我设定的一条规则是 span,那么含有下面这个内容的段落就会被忽略:

      Some text contains span element.

      如果你选择是 HTML 元素范围,那么设定的规则就会对整个 HTML 元素进行匹配。比如我设定的一条规则是 class="test2"<span>span</span>,那么下面这个段落就会被忽略:

      <p class="test2">Some text contains <span>span</span> elment.</p>
      

      不过正如在项目 Issue #41 所解释的那样,目前这个功能有个缺点,就是插件抽出的元素用户无法控制。后面的版本会推出忽略元素功能,可以在插件抽取元素过程中控制忽略哪些元素不需要翻译。比如我想忽略整个 table 元素,只需要通过指定一个元素名 table 就可以忽略整个表格,而不是写多条规则忽略插件已抽出的 tdtd 元素中的 span 元素。

      另外,插件正在开发一个可以更精细的控制翻译内容的“高级翻译”功能,会在界面上将这些不太直观的功能可视化。

  11. 有百度翻译的api,但没有网络代理,设置为百度后依旧使用Google(Free),如何解决🥺

  12. 哇,这个新版本厉害了,速度真的显著提升~棒!

    后期版本有可能增加回译功能吗?(通过中文再翻译回英文,以确定其准确性,不知如何表达。。)

    现在的速度已经很好了,翻译的准确率是否会更加优化。

    不知道是不是这一种。→https://blog.csdn.net/dongrixinyu/article/details/108660386

      • 回译我没太弄懂。

        但是不知道能否使用这个策略,以增加翻译准确度:

        调用多个主流的翻译引擎,同时翻译,然后系统自动选取“相同率”最高的那条作为翻译结果。

        举例说明:A代表相同部分,B代表不同部分

        英文翻译

        谷歌:AAAAAAAAAA
        百度:AAAAAAAAAA
        微软:AAAAAAAAAA
        有道:AAAAAAAABA

        上面这种情况,那么就把微软给删除

        谷歌:AAAAABAAAA
        百度:ABABABABAB
        微软:AABABAABAA
        有道:AAAABAABAA

        这种情况,就只留下谷歌翻译

        意思就是:

        设定优先级,保留相同率最高的那条翻译,如出现优先级无法辨别,则引用主流的翻译引擎

        大概是这个意思,不知道现不现实。

        这个网页版翻译引擎:

        https://languagex.com

        里面就有可以调用多个翻译引擎的,输入一句中文,可以调动谷歌、百度、微软、deepl给出翻译,然后选出叠重率最高的那条作为最终翻译结果,想法大致就是这样子。

  13. 您好,请问翻译出来带有一些特殊符号,是哪里出了问题了吗?

    英文的PDF格式翻译成中文的mobi形式

    出现例如像:

    翻译出来的文件有一些特殊符号:

    {{ }}、☑☑☑☑(里面没有打勾),

    像出现这些奇怪的符号,是哪里出了问题了吗,需要如何解决

  14. 请教一下您:

    如果我的书籍是PDF,但是PDF是图片类而非文字类

    我有什么办法把PDF先变成文字类呢?