Google翻译的中国基因

2011-04-22 13:31:04 | 作者: 来源:

【编者按】2004年,Google创始人之一Sergey Brin使用市面上的网络服务来翻译韩国粉丝发来的邮件,结果显示:“生鱼片带着它的愿望,用Google搜索绿洋葱!”这样的结果,让Sergey认为Google在这方面可以做的更好。

 

  ——专访陈雍昇,Google翻译研发经理

  2004年,Google创始人之一Sergey Brin使用市面上的网络服务来翻译韩国粉丝发来的邮件,结果显示:“生鱼片带着它的愿望,用Google搜索绿洋葱!”这样的结果,让Sergey认为Google在这方面可以做的更好。

  不久前,Google翻译发布了iPhone和Android版本,让用户能够随时使用翻译服务,更加轻松便捷地跨越语言障碍。该手机应用可以识别15种语言的语音输入,朗读或全屏显示23种语言的翻译结果。对于非拉丁字母语言,例如中文和日文,应用将标注拼音或罗马字读音,便于非母语用户读出。与Google翻译的桌面应用相同,移动翻译也能够翻译58种语言书写的字词和短语。

  移动翻译设置了一些常用内容的翻译收藏,即便在没有互联网连接的情况下也可读取,实时翻译则需通过WiFi或移动网络连入Google云端获取结果。这款产品对于很多用户来说非常方便,如果身在国外,不知道某句话用外语该怎么说,只需打开程序,把想说的话念给手机,然后点击“翻译”,手机就可以把译文朗读出来。

  基于统计的机器翻译

  Google翻译产品在全球只有两个团队,一个是在Google总部,另一个就在中国上海。“Google翻译在上海成立,主要因为当初有两个人喜欢做翻译,其中一个就是尹俊(Google翻译产品研发领导,作者注),他可谓是Google上海翻译团队的创始人。通过美国翻译团队开展合作,上海的翻译队伍越来越大,现在已经达到十几人的规模。目前美国总部的翻译团队主要负责后台的平行语料数据,上海翻译团队负责手机、桌面电脑翻译应用的开发。Google的创新模式常常是自下而上的,工程师可以在工作中发挥个人兴趣,如果做出成绩,就有可能凝聚逐渐扩大成一个团队。”在陈雍昇看来,上海团队的建立要归功于Google的创新模式。

  现今大部分的商业翻译系统都是属于规则法机器翻译,需要做大量词汇与语法的工作。Google翻译则采取基于统计的机器翻译,这是IBM科学家在1993年提出的理念,具有划时代的意义。Google现在支持58种语言的互译,翻译团队的成员们掌握的语言远少于这个数字,这也是统计翻译的魅力所在。统计翻译的具体原理是,先往计算机里输入大量的文字文本,搭建涵盖源语言和目标语言的平行语料库,构建统计翻译模型。这些模型可以帮助Google在源语言与目标语言中寻找各种相互关系,得出某些特定单词、短语或文件的最佳翻译结果。针对某种特定语言,Google翻译分析的翻译文档越多,译文的质量就越高。据陈雍昇介绍,Google翻译主要有四个步骤:

首先,系统需要

更多

快讯

三言智创(北京)咨询有限公司企业文化