假如我们不用再学外语
2030年翻译机真能突破语言障碍?
■策划/发现工作室
■采写/陈蘅
■供图/《图形科普》杂志社专供
西方圣经上说,挪亚的子孙人口众多,遍布天下,且只讲一种语言。人们齐心协力用土坯砖和黑沥青建造“通天塔”,上帝极不高兴,就让他们说不同的语言。由于突然之间大家语言不通,彼此无法交流和理解,工程不得不停止了,这座未完成的塔就叫“巴别塔”。从此以后,人类就一直在找寻沟通的途径。
先是翻译、再是世界语,直到目前的机器翻译,甚至还有人提出随着语言的逐渐消融,最终回归到人类造“通天塔”之前的原初状态,说同一种语言。无论是哪种方式,人类是否真的能改变上帝的意旨,彻底扫除人类之间的语言障碍呢?
■科学家:“三五十年内,我们将为人类扫除语言障碍”
目前,随着中国加入国际语音翻译协会项目,“语言翻译”前景看好,似乎在不久的将来能为人类扫清语言障碍。据中科院自动化所模式识别国家重点实验室研究员徐波介绍,C-starⅢ项目将从2001年正式启动,到2004年结束。其目标是利用公共电话网络和国际互联网,在四年内实现通过手机、电话、计算机终端等设备进行不同语种人类之间在旅行期间的同声场景对话,包括预定旅馆、购买机票、餐馆对话、外币兑换等,更重要的是该项目把多国语音的直接翻译作为一个科学工程!通过建立系统性的平台、演示而推动该技术的迅速发展,在30至50年内最终达到彻底扫除人类之间的语言障碍。
据中科院声学所专门研究语音交互技术的杜利民博士介绍,中国着手研究语音翻译系统已有两年的历史。七国语音同声互译的原理是,先将本族语识别后翻译成中间语言,再用中间语言与其他语言互译。但目前国际语音互译计划的词汇量仅限于10000个字词,对话场景也仅仅初步定为预定旅馆、购机票、餐馆对话、外币兑换等场所。
纵然如此,在技术上进行直接语音翻译仍有很大的挑战性。徐波介绍说,直接语音翻译集语音识别、机器翻译和语音合成于一体。首先是语音识别,尽管目前实验室里的语言识别率已达90%以上,但由于现实生活中的口音、方言、背景噪声等一系列因素,识别率仅为60%左右,还需我们在近几年内有进一步突破。
其次是机器翻译,由于不规范的文本以及各种语言的自身特点,如汉语的非时态,句子的歧义等增加了翻译的难度,而最难的是把两者合在一起,即语音合成。目前除上述七国之外,许多国家都在进行这方面的研究,国内如IBM等公司,也一直在做相关研究,而日本的研究,几十年来一直就没有停止过。
况且,现在新的方法比较多,如语意法、实例法、模板法以及统计法等。对于像“Howdoyoudo?”一类的句子,对其进行语法分析,怎么都分析不通,但用实例法像公理一样把它规定下来,就简单多了。今后若能有更多更好的方法并能把这些方法结合起来,语音翻译势必有很大突破,而且不久就会有突破。徐波描述了三五十年后的诱人场景:对于不用对外国进行学术研究的人,将不必每天疲于学外语、过级,不必有很多翻译,即使联合国开会时也一样,只需每人带上一副小巧精致的同声自动语言翻译机器,就可实现与任何其他语种的人进行自由交流。
徐波说,“我们的目标就是想通过纯技术的力量经过哪怕几十年努力,把人类彻底从语言障碍中解脱出来”。
微软中国有限公司周明说:“语音翻译系统之所以难攻克,是因为牵涉到了千变万化的自然语言,但自然语言也不过很复杂而已,总有一天,或许要不了多久,人类终将会攻克它。”
上一页 下一页