据国外媒体报道,研究人员开发了一款新软件,可以将英语口语翻译成中文口语,同时也会保留语调和节奏,因此即便是通过机器翻译的语音听起来依然像是初始的声音。微软公司认为该研究实现了突破,使得瞬时翻译系统出错的次数下降了,系统研制的技术蓝本借鉴了大脑的工作方式,以提高翻译的准确性。
微软公司研发部主任里克·拉希德(Rick Rashid)在天津对该软件设计项目进行了详细的解析,拉希德在最后几分钟的陈述几乎在瞬间被这套来自微软的快速口译系统翻译成中文,而且快速翻译机器生成的语音还保留着他口语的风格。正是由于该款新型快速口译软件,使得快速翻译成为了可能,这项成果要感谢微软实验室在早些时候对相关技术的突破。
早期的研究工作抛弃了传统的语音翻译系统模式,转而支持统计型模型,使得机器在捕捉人类声乐能力上具有更好地表现。随着计算机技术的改进,进一步提高了软件对语音数据的识别处理能力,但错误率仍然处于20%至25%之间。根据里克·拉希德先生的相关记录文件,早在2010年,微软的工作人员与多伦多大学的科学家进行合作,通过深度神经网络结构对瞬时翻译系统进行改进,正是由于深度神经网络在识别声音的工作方式与我们的大脑相似。里克·拉希德认为该技术可应用到语音转换上来,并将错误率控制在15%的范围内,这项改进也被喻为戏剧性的变化。
针对翻译过程中出现的错误率,研究人员开始对类神经网络进行训练,使得错误率进一步降低。当然,目前这套快速口语翻译系统仍然存在问题,比如在英文文档和翻译成口语化中文时有时会出现非常幽默的结果,尽管如此,这项技术的发展还是非常有用的。许多不同的技术公司,如AT&T公司、谷歌(微博)公司都有相似的
同声翻译软件开发项目。日本电报电话公司的NTT DoCoMo手机公司此前展示了一个智能手机应用系统,方便日本语使用者与外国人进行交谈,使之能利用自己的母语无障碍地交流。
(责任编辑:tysd001)