百度AI同传亮相全球人工智能技术大会 助力国际学术交流

7月25日-26日,2020全球人工智能技术大会在杭州正式拉开帷幕,近160位国内外人工智能领域的专家、学者汇聚杭州,围绕AI学科前沿和尖端技术展开研讨,共话AI未来。本次大会共吸引了超过1100万人次在线观看,为了让国内外观众第一时间了解大会内容,百度翻译为大会提供了机器同传服务。

随着经济全球化的深入,国际交流日益频繁,各类国际会议数量不断攀升,超过95%的国际高端会议都采用同声传译的方式。据不完全统计,2019年在中国举办的国际会议超过13000场,而国际会议口译员协会(AIIC)——会议口译唯一的全球性专业协会——仅有约3000名会员,其中汉语普通线人。在供需严重不平衡的情况下,能力日益增强的机器同传在国际会议场景下身影频现。

面对领域多样、需求复杂、实时性高的会议场景,百度翻译提供了全面高效的机器同传解决方案。

一直以来,如何平衡时延与准确度都是同声传译的难点问题。如下图所示,传统的文本翻译等待原文输入结束后才进行翻译,无法满足同传高实时性要求。要降低时间延迟,就需要对演讲者的内容同步翻译,但这样由于缺乏完整的上下文语义信息,会导致翻译出错。

针对以上问题,百度翻译提出业界首个语义信息单元驱动的机器同传模型(效果如下图),实时判断演讲者所讲内容是否形成了完整的语义单元,判断为是则进行翻译,否则继续等待。该技术大幅提升了翻译准确性,同时缩小了时延。

此外,传统的翻译模型一般仅针对当前的输入内容进行翻译,由于缺乏全局信息导致翻译不准确。例如,下面的例子中,在不同的话题下,单词有不同的释义。针对这一问题,提出了融合全局话题信息的翻译模型,进一步提升了翻译准确率。

俗话说,隔行如隔山,在涉及专业领域如医药、科技等场景下,想要准确地翻译术语,往往需要同传译员在会前很短的时间内了解和熟悉大量相关领域的专业知识。如果一场大会包含多场分论坛,专业领域差异大,译员要同时支持数场论坛同传,更是难上加难。

如果用没受过特殊训练的机器来翻译,其翻译结果也可能不尽如人意(如上图所示)。针对此类问题,百度翻译通过迁移学习、预训练加精细化训练等技术,迅速提升领域模型的翻译效果,满足多领域翻译需求。

定制领域机器同传的加持可以极大地解放人力。通过对专业领域相关语料的不断学习,机器翻译结果会更智能,由于机器先天的记忆力优势,其复用性也会更高。

此外,本次大会专业性强,很多嘉宾在演讲时经常出现中英文混合说的情况,这无疑给语音识别造成了极大的困难。基于百度领先的中英混合语音识别技术,在演讲者语速快、术语多、中英混合说的情况下,仍可以准确地识别和翻译。

近年来国际会议愈发多元化,随着会议召开的地点、形式、人数、与会者语言的不同,主办方和参会者都对同传服务提出了更多的服务要求。

百度翻译积极响应市场变化,其同传方案面对包括传统线下会议,远程会议,以及线上线下融合的会议等多种形式,以及主题演讲、多人讨论等多种场景,推出了全场景的解决方案,会议主办方可以为观众提供投屏字幕和手机视听两种不同的服务体验。

新的形式带来新的挑战,比如远程直播会议就为同传增加了不小的难度:为了适应网络带宽,在线会议软件对声音信号进行压缩编码处理,同时传输过程中易受多种信号干扰,原始声音信号不稳定,远程信号传输还会存在由于丢包造成的变音、吞音、丢音等异常现象,对同传挑战极大。

百度翻译同传搭载百度语音自研的SMLTA声学建模技术,提升识别的准确率。同时,通过对音频信号的加强处理,提升了识别的鲁棒性。

与此同时百度翻译同传还支持中英日韩多个语种,可同时支持多语言与会者会议的同传需求。除此之外,百度翻译同传还支持会议同传记录,术语专名解释等会议扩展能力,为与会者提供一站式服务。

受全球疫情影响,大多数会议都选择线上直播,同时,一个大会中多场分论坛并行已经成为标配。这增加了传统机器同传线下设备部署的成本。

针对此类问题,百度翻译同传创新性地采用在线云端部署解决方案,极大降低了部署难度和成本。该方案可根据需求迅速扩容,高效满足不同形式的同传需求。这大幅缩减了线上、线下机器翻译同传的成本,让不同的企业和组织能够更加实惠、便利地使用同传产品。

机器同传产品和技术正在快速迭代,百度翻译的突破性技术和方案解决或部分解决了同传行业的一些痛点,并广泛应用于大型国际会议。同时,针对整个行业共同的技术难题,百度翻译也会与同行一道,努力寻求更好的解决方案。相信在人工智能技术的加持下,机器同传会有更广阔的天地。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注