DeepL发展史:一家初创公司与机器翻译巨头的抗争

  AI翻译颠覆了我们的沟通方式,也以前所未有的方式打破了语言沟通障碍。预计到2026年,该行业的全球市场规模将增长至123亿美元,而无数参与者都希望能从中分得一杯羹。

  而总部位于德国科隆的DeepL,却凭借着初创身份与谷歌、微软等科技巨头一路竞逐,逐步的提升着机器翻译的行业标准。

  这家年轻企业的首款产品是在线词典Linguee,自计算机科学家Jarek Kutylowski兼公司CEO于2017年创立以来始终保持高速发展。

  Kutylowski出生于波兰,12岁时移居德国,刚转学时甚至一句德语都不会说。这让年少的他第一次认识到语言的重要性,以及跨语言交流的巨大难度。

  时间快进到2017年,他创立DeepL的初衷,是意识到神经网络这项突破性技术有望以前所未有的方式彻底攻克难题。他表示:“我们猜测机器翻译应该会朝着这个方向发展,也相信这项技术将发挥巨大作用。看准了这个机会,我们鼓起勇气想要创造一些伟大的成果。”

  神经机器翻译(NMT)就是基于神经网络的翻译技术,慢慢的变成了迄今为止最为成功的机器翻译方法。与之前的版本相比,这项技术更快、更准确、资源占用更少也更易于扩展。

  DeepL使用该技术提供免费的高质量翻译服务,且主要面向B2B市场。自企业成立以来,他们已服务了10亿以上的用户,目前拥有超过2万家企业客户,其中不乏爱思唯尔、富士通和Mastodon等知名公司。

  Kutylowski解释道:“翻译对企业来说至关重要。现如今,慢慢的变多的公司开始走向全球以开拓海外市场,希望能在更广大的疆土上吸引客户、创造价值。”

  而对翻译的主要需求,集中在那些涉及大量许可证的行业,比如法律服务。“通过观察,我们得知这也是客群需求最强烈的领域。”

  截至目前,DeepL已经支持横跨欧亚大陆的31种语言。2023年,公司推出AI写作助手,也成功跻身独角兽行列。尽管融资环境严峻,该公司还是在1月筹集到一笔数额不明的资金(估计为1亿美元),目前市场估值达到10亿欧元。

  DeepL自信地宣称,可提供“世界上最好的”AI翻译服务。而且与竞争对手的产品相比,该公司的方案质量更高,平均准确率高达3倍。

  自信满满的口号源自“盲测”结果,即由专业翻译人员在不知文本来源的前提下挑选准确率最高的翻译结果。

  通过一系列测试和实验,我发现DeepL的表现确实名列前茅。我首先输入了加缪《局外人》小说中的一段话,并分别用DeepL和谷歌翻译将其从法语翻译成英语。

  尽管文学类文本并不属于这些工具的主要设计用途,但我还是决定从这个方面入手,毕竟纯文学对AI系统来说肯定更有难度。

  可以想见,文学翻译相当复杂,依靠的不止有对语言的熟悉程度。其中还涉及更高水平的创造力,对于作者观点、文风和社会历史背景的深刻理解,同时要能在不同文化间实现语义转换。

  从续订来看,DeepL的表现远远优于谷歌。虽然它还是遗漏了一些隐喻性表达,在某些意指和常识上也犯了错误,但最终文本读起来确实更接近原文的表述。

  我用自己的一篇文章进行了重复测试,希望复查翻译工具是否确切表达了我说的意思。这一次,任务是把英语文章翻译成希腊语。

  这次DeepL的表现仍然更好。尽管仍在几处纰漏,但它的希腊语翻译结果更细致、更自然,也更符合原文的含义。我知道很多朋友可能看不懂希腊语,所以你们可以随便找点文字自己测试一下,看我说的对不对。

  Kutylowski认为,在不“”的前提下用目标语言表达正确的含义,首先得在准确性和流畅性之间找到适当的平衡。而这在很大程度上要视语境而定。比如说,技术文档对于准确性要求更高,而营销文本则更多强调流畅性。

  尽管面临挑战,但他坚信AI有能力掌握哪怕最复杂的语言。他补充道:“如果忽然出现某种要求我们学习的外星语言,那么只要有足够的翻译材料作为支撑,我们没准同样能训练出相应的翻译模型。”

  Kutylowski对于市场之间的竞争似乎毫不担心。他强调,“我们从始至终都在跟大厂竞争”,还提到谷歌翻译仍是DeepL目前最大的竞争对手。

  在他看来,这家初创公司的优势可以归结为三大要素的结合:努力工作、优秀团队还有专心一意。

  “专心一意非常很重要。翻译并不是谷歌的核心业务,只能算他们上百种服务中的一种。同样的标准放在大语言模型和OpenAI方面是相同,翻译只是他们关注的一个方向,他们必把GPU分散在各种各样不同的任务上。但我们只专注单一特定领域。”

  从技术角度来看,DeepL的成功则源自其神经网络架构、人类编辑的输入还有训练数据。

  这家初创公司依据大量数据(主要来自互联网)进行模型训练,并使用特殊的网络爬虫来自动查找翻译并评估内容质量。他们还使用强化学习等方法向AI提供积极反馈,引导其不断的提高翻译水平。

  Kutylowski还补充道,另一个重点是在模型的翻译能力和用目标语言构成句子之间寻找适当的平衡。“为此,我们在单语数据模型训练和目标翻译模型训练方面投入了大量精力,数学团队则负责处理大量细节。”

  Kutylowski承认,近期对于AI热潮的广泛关注主要源自大语言模型(LLM),这也让整体环境变得更具挑战、节奏更快。

  DeepL团队现在必须跟上发展的脚步:新模型层出不穷,开源项目所在多有,学术研究和其他公司的成果都需要关注。

  “如今的机器翻译已经掀起一波竞赛”,那要靠怎样的策略才能在这场比赛中胜出?

  在Kutylowski看来,一方面当然是不停地改进革新,确保采取正确的步骤来实现高质量翻译目标。另外就是适当投资,确保找到比较合适的资本和技术团队。

  但与此同时,人类对于AI的关注和呈指数级增长的发展速度也带来了新的技术机遇。“有些事情我们在两、三年前就考虑过,但当时的技术还不够成熟。”

  比如说贴合企业风格的个性化翻译和更具交互性的翻译体验。DeepL还开始研究票据翻译,并从头开始训练自己的大语言模型。这在某些特定的程度上要归功于他们新的超级计算机集群DeepL Mercury。

  这些大模型有望进一步提升翻译质量,并为用户所带来新的交互工作流程。更多功能和应用选项将在2024年内陆续推出。

  机器翻译既帮助更多人克服了跨语种沟通障碍,同时也提出了新的问题:既然AI翻译这么出色,未来我们是不是就没必要学习外语了?

  Kutylowski的回答是:“随着AI的普遍进步,我觉得全人类都需要认真思考一个问题:我们应该学什么,我们想要学什么?”

  他认为如果单纯是为了在异国他乡工作和生活,那随着科学技术的发展演进,学习语言的必要性确实会逐渐降低,但这并不意味着学习外语的价值也将随之下降。

  他以数学为例,提到虽然在真实的生活中我们根本用不到在学校里接触过的大部分复杂方程,但学习数学的过程仍然很重要,甚至能够说是培养理性思考能力的根基。

  语言学习也是如此。在学习一门语言的过程中,我们实际也是在学习怎么样形成思维和表达观点——这对每个人的发展都至关重要。学习外语、特别是掌握跨语种思维能力,对于个人乃至整个社会都有着深远的积极意义。

  研究表明,学习第二语言实际会改变大脑结构。具体来讲,它增加了灰质密度(对应大脑中的神经元数量)和白质完整性(即连接大脑中不一样的区域的神经纤维系统)。也就是说,学习外语不但可以增强大脑整体功能,还有助于提高记忆力、注意力、集中力和其他关键认知能力。

  此外,大量研究已经把语言学习跟良好的考试成绩、就业能力、创造力、沟通技巧乃至跨文化认知联系了起来。

  Kutylowski总结道:“因此,无论是出于个人兴趣,还是大脑与性格的培养与发展,都应该重视学习语言。哪怕手机上就有最好的翻译工具,如果要结交来自不同国家的朋友、发展一段跨国恋情,至少得能做到直接交流。至少我不希望我们大家坐在一起,还在各自摆弄手机。”

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

上一篇:
下一篇: