试用过这个同传机器之后,不禁要感慨:在笔译大批失业之后,口译这个工作也要被机器取代了吗?
就在上个月,全球最大的外语学习社区多邻国(Duolingo)开掉了世界各国的数千名合同工翻译,全面转用生成式AI来翻译用户的学习界面。在Reddit论坛的多邻国社区上,一位被解雇的翻译贴出了裁员通知,他们整个组只剩下了两个人,而即便是仅剩的翻译,主要工作也是矫正AI翻译的内容。
很多多邻国用户对这些翻译多年来的贡献表达了感谢,也对AI取代人类翻译的前景表达了感伤。一位用户写道,“很不幸,AI在翻译领域全面取代人类是迟早的事情。”
是的,这是迟早的事,而且正在变成现实。十多年来,我们已经越来越习惯使用谷歌等翻译工具翻译网页和文字,机器翻译的准确性也在不断提升,现在生成式AI的到来更加速了这个笔译被取代的过程。
现在看起来,口译也要开始逐渐被取代了。今年的CES上,一家来自中国的创业公司发布了一款同声传译器,给人留下了深刻印象,也让人看到了AI取代口译的现实解决方案。这就是深圳创业公司时空壶发布的X1同声传译器,也因此获得了2024 CES创新奖。
我是在CES开幕第一天注意到这家公司的,因为他们选择了和LG、海信等诸多知名大企业一道,在拉斯维加斯MandalayBay会展中心召开新品发布会。这里通常并不是创业公司的新品亮相舞台。
时空壶选在这个时间段和这个会场召开发布会,意味着他们对自己的产品和技术有足够的自信,并不害怕和企业巨头同场争辉,去争夺全球媒体记者的参加与曝光度。
现场有不少媒体排队等待参加这场发布会,有中国媒体,也有海外媒体,有说英文的,也有说日语、法语、西班牙语等其他多国语言的。显然,如果一款同传机器可以让人克服语言障碍,那么在全球绝大多数国家都会是刚需。
令我惊讶的是,主持发布会的时空壶创始人兼CEO田力非常年轻,直接用流利的英语开始发布新品,而且现场完全没有使用提词器,这样的场景在CES上并不常见。
有趣的是,发布会结束后,一位日本记者询问田力,既然他英语如此流利,沟通毫无障碍,为什么会想到创业做翻译机。田力表示,虽然自己的英语不错,但中国还有大量的民众需要学习英语。
无独有偶,卡内基梅隆大学计算机教授冯安(LuisvonAhn)当初创办多邻国的直接动力也是希望给他的危地马拉同胞提供一个更加有效和经济的英语学习平台。
不过促使田力创办时空壶的直接原因是,他的父母此前在欧洲旅游时,即便下载了10个翻译软件,却依然无法和老外对话交流。这次旅行让田力父母深切感受到了语言障碍,也让田力看到了创业的蓝海机会。
时空壶已经创办了七年时间,先后推出了翻译机、翻译耳机等数代产品,并自创立之初就开始拓展海外市场,第一款产品就通过Kickstarter平台众筹上市,随后则通过官网和亚马逊等渠道在海外发售。时空壶的数据显示,目前他们全球用户总数已经超过了30万人,海外市场营收占比超过了七成。
过去数年,翻译设备市场不断更新发展,时空壶也不断更新自己的产品线:在市场主流还是手持翻译机的时候,他们就推出了翻译耳机;在各家都发布了翻译耳机的时候,他们又开始做同声传译器。
回到话题,此次发布会的新品,是时空壶的旗舰新品X1同声传译器。这个产品包括主机和两只耳机,融合了翻译软件、手持翻译机和翻译耳机等多个产品,支持40多种语言和90多种口音,0.2秒出翻译,平均翻译准确率达到了95%。从简单的出国旅行问路,到复杂的多语言会议,这部机器覆盖了各种场景的翻译需求。
为了真正做到一部机器走遍全球,时空壶使用了自研翻译引擎,并且与世界各地的本地化翻译引擎进行定制化合作,综合条件来匹配用户最佳翻译服务,全球涉及150多个翻译引擎,覆盖200多个国家地区。
对比此前的翻译机器,使用X1同声传译器进行沟通摆脱了传递翻译设备,也不需要连接App,几乎做到了随说随译,达到了摆脱语言障碍进行自然交流的体验。
发布会后,我和一位记者在现场测试了这部同声传译器,只需要拿出耳机各自戴上,就可以直接进行自然对话。我说中文,他说西语,我的耳机传来的是中文,而他听到的则是西语。在聊天的过程中,X13.4寸屏幕上还可以自动记录对话内容,并支持一键导出。
对媒体记者来说,这是个非常实用的功能,意味着哪怕语言不通,也可以直接采访,而且结束后还可以拿到双语的记录,可以马上用于写稿。
而且,我注意到X1还有一种很奇妙的功能“音色克隆”,即通过不断使用和学习来模仿用户的音色。解释下这个功能,以往翻译机传来的都是冰冷生硬怪异的机器声音,但有了音色克隆之后,耳边听到的却是对方的音色;举例来说,你明明是在说中文,但对面的巴西人在X1中听到的却是你在说葡萄牙语的声音。而且,用的越久,声音就越像。
不过,X1同声传译器的功能远不止于此,这是一部面向高端跨国商务群体以及跨国公司等B端群体打造的翻译终端。这意味着X1拥有有专业的跨语言沟通系统来支持工作,并且可以通过无线连接与电脑、手机等搭配,实时翻译线上内容,用于商务工作。
大致介绍下这部机器的几个商务使用场景。除了当场试用的面对面交谈,如果是不同国家的两人通话,那么直接拨打X1的设备号码,无需手机就可以开始通话,X1会替通话双方进行翻译,让不同国家之间无障碍交谈。
参加会议、旁听讲座,却听不懂主持人说什么?在旁听翻译模式下,将主机置于声源模式下,屏幕就可以显示双语内容,耳机同步播放翻译,并且提供文字加录音的完整记录,方便事后查询和回顾。如果是网络会议,可以通过输入会议号来加入会议。
我还注意到了另外一种复杂的多人会议模式,例如跨国企业内部多语言会议,这也是最体现翻译技术实力的场景。在这种场景下,使用多部X1进行组网,只需要碰一下就自动加入,变成一个翻译团队,支持最多205种语言多向同传,而且还可以随时切换不同语言。为了针对高端商务市场的同传需求,X1还加强了数据保护、监听保护和泄露保护三大防范措施。
不妨设想一下,如果这些使用场景交给人类同传来做会怎样?
经验丰富的人类同传或许可以做到信达雅,但同样面临着诸多限制因素:高昂的人力成本,有限的工作时间,繁琐的法规要求等等。而且,同传的翻译质量也完全取决于译者水平,无法保证一致稳定的输出。
由于同传是一个非常消耗体力和脑力的工作,为了保证同传质量,加州规定一个项目必须同时聘请两个同传轮流进行,每人的持续工作时间不得超过15分钟。如果用工方为了省钱只聘请一个同传,或是要求同传免费加班,都会被拒绝服务,甚至是起诉到劳工法庭。
而且,同传的收费也是相当不菲。硅谷一位资深同传向我透露,目前加州同传翻译平均时薪在200-250美元不等,每次同传至少三小时起步。一个全天会议,聘请两个同传至少需要两千美元。而且如果是诸多参会者提供的会议同传,还需要加上专业同传设备以及设备调试人员,一天活动下来,同传费用轻松超过五六千美元。
与此同时,聘请同传还需要提前预约,不可能做到随传随到,跨国公司内部的商务会议也无法保证每次都找到同传,只能使用英文开会或者公司内部人员临时翻译。这意味着内部会议沟通也无法保证准确性。
这些目前的同传需求痛点,正是X1同声传译器的卖点。在官网或亚马逊购买售价799美元(国内天猫售价4999)的X1设备,就可以随时提供服务,没有人工费用,也不用担心加班超时,而且翻译质量持续稳定。
或许未来的重要商务活动依然需要优秀的同声传译者,但可以肯定的是,随着同声传译终端技术的不断成熟,或许未来AI可以承接绝大多数的同传需求。《圣经创世纪》上记载,上帝为了阻止人类建造通天塔,打乱了他们的语言,让人类彼此无法沟通。而现在,科技发展让跨语言沟通不再是障碍。
继续阅读
阅读原文