辽宁日报:这是不是涉及到语音识别技术? 朱靖波:是的,还不仅是语音识别这项单一的技术,语音即时翻译还包括机器翻译和语音合成两个技术系统。
辽宁日报:这是不是涉及到语音识别技术?
朱靖波:是的,还不仅是语音识别这项单一的技术,语音即时翻译还包括机器翻译和语音合成两个技术系统。可以说即时语音翻译是当今自然语言处理领域三大技术的综合运用。
辽宁日报:这是怎样的一个过程?
朱靖波:简单来说,一个人在电话里用中文说的一段话,通过 “语音识别”技术将这段话变成中文文本,再通过“机器翻译”技术把中文文本变为英文文本,然后通过“语音合成”技术把这个英文文本变成英语发音,传到电话另一端。
其中,语音识别通常包括两个层面的问题,一个是对发音的识别,一个是音所对应的字、句子的识别,所以识别就是要用计算机语言建立一个声学模型和一个语言模型。口语识别是个难关,因为如果两个人随意地谈话,这种语法不规范和语序不正常的情况,会给语义的分析和理解带来很大的困难。总之,鉴于语音信号的多变性、动态性、瞬时性,语音识别技术与人大脑识别必然会有很大差距,但科学研究会让这种差距不断缩小。
辽宁日报:语音合成是把文字资料“读”出来,这就相对容易一些了吧?
朱靖波:是的,只是读出来的话就好办些,经过多年的研究,语音合成技术已比较成熟,开始从实验室走向市场。未来的语音合成技术研究重点放在提高合成语音的自然度、丰富合成语音的表现力上。
编程和运算量太大对计算机硬件要求颇高
辽宁日报:机器翻译是文本对文本的识别,这个难度体现在哪里?
朱靖波:虽然没有了声音的干扰,但是机器翻译却是最难的,因为它是双语间的一种语言中的一个句子可能对应另一种语言的十几种译法,所以编程所要建立的语料库十分庞大。这个语料库就相当于事先将所有双语词、短语、句子存储起来,并排出一定的概率,赋予计算机一定的记忆,如果一个语料库的规模有几百万句对,通常也只能适用于较小的翻译领域。对于某些领域和某些语言对而言,获取大规模的平行语料是非常困难的。目前即时语音翻译的最大瓶颈就出现在计算机翻译上。我个人认为,目前机器翻译技术具有可用性,但还存在很多技术瓶颈问题,机器翻译性能还有待进一步提升。但在一些特定受限领域或简单对话条件下,机器翻译性能还是可以的。
辽宁日报:这几项技术都要做大量的语言统计工作?
朱靖波:可以理解为“编程”运算量特别大,算法非常复杂,形成的数据库也特别大,因此,语言处理研究对计算工具如计算机硬件性能要求非常高。在过去,计算机硬件还比较低级,研究就会受到很多限制,近几年计算机系统本身有了长足的发展,特别是以超级计算机为基础的云计算,有着超强的计算能力,支持着语音识别、机器翻译向纵深发展和多领域扩展。同时,语言处理技术涉及声学、语言学、心理学、数字信号处理、优化理论、人工智能、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,需要多学科的合作。
辽宁日报:目前这三种语言处理技术是否有了应用?
朱靖波:作为独立的技术,语音识别、机器翻译、语音合成都具有可用性,但就目前来说,技术虽然在不断进步,但还有许多不成熟之处,所以它们的应用也受限,只能用在特定的服务上或者特定的领域。比如打电话问天气、问路线,这个提问一般比较固定,系统本身带有语音识别软件的话,就可以不用或少用人工服务,让计算机自动接听用户的电话,进行判断和解答。机器翻译技术在国际交流密切,智能手机、互联网普及的今天也很有用场,比如,用QQ等聊天,你打汉字,发送后,对方收到的可以是英文,因为网站的服务器上装了机器翻译软件,手机发短信也是一样,两个母语不同的人就可以部分地消除语言障碍进行交流。目前市场上已经有了一些机器翻译软件,迈入了实用化阶段。
(责任编辑:Allen)