Google翻译的中国基因

2011-04-22 13:31:04 | 作者: 来源:

【编者按】2004年,Google创始人之一Sergey Brin使用市面上的网络服务来翻译韩国粉丝发来的邮件,结果显示:“生鱼片带着它的愿望,用Google搜索绿洋葱!”这样的结果,让Sergey认为Google在这方面可以做的更好。

,并且为朱文章加拨了人力支持。大概两三个季度后,由朱文章领导开发的iPhone版Google翻译正式发布。在超过一周的时间里,它一直是全球排名第一的免费软件。

  理论上来讲,Google能在电脑端能够多少语种的互译,也能在手机端提供那么多。而在实际情况中,移动翻译提供多少语种的语音翻译,取决于其支持多少语种的语音识别。语音识别需要庞大的数据来源,才能建立很好的分辨模型,对此Google早有准备。2007年,Google开始提供GOOG-411)处理语音搜索。虽然GOOG-411并非Google的重要收入来源,但它为研发人员收集了海量数据,使之能够不断完善语音识别算法。一年后Google推出的语音搜索,足以比肩其他公司历时数年才搭建起来的类似系统。据Google称,这款语音搜索服务为Google Android和苹果iPhone等智能手机平台上“更多富有野心的服务提供了基础”。例如,装有Froyo软件的Android用户可通过语音控制手机的绝大部分功能,而Google推出的 iPhone应用也内置了语音识别功能。

  Google2010年10月关闭了这项服务,并在声明中表示,计划将相关资源投入到“使下一代Google产品和服务支持多语种语音的技术”中,我们现在看到的语音翻译即是成果之一。可以预见,语音识别未来将成为Google更多服务的特性。

  虽然移动翻译接收的源语言多数具有口语化的特点,在陈雍昇看来,这对翻译质量并不会造成太大影响。首先,用户使用语音翻译时,对自己要讲的内容一般都有明确的认识,所以语句的流畅程度跟桌面翻译的差异不大。其次,人们使用语音翻译时的说话方式不同于演讲,多数情况下语句简短,对于语音翻译来说不难应对。“二者最大的差异在于用户体验方面。电脑键盘使用很方便,而手机键盘很小,我们必须想办法方便用户输入源语言。此外,语音翻译的使用环境可能跟办公室有较大区别,相对于口语中偶尔出现的停顿和重复现象,外界杂音对翻译质量的影响更大,所以我们得过滤不必要的讯息。”

  过滤杂音的任务多由翻译程序完成,研发人员可以设定一个音量阈值,将低于此值的杂音筛掉。此外,如果语言出现停顿,将其作为句子结束还是“正在考虑、尚未说完”来处理,也是翻译程序可以决定和控制的。再者,“如果用户说错了一两个字该怎么处理?让其重说一遍还是直接修改那一两个字,这些用户体验方面的问题,都可以通过完善翻译程序来提升。”

陈雍昇表示,“除了之前的语音搜索,Google有很多产品用到语音方面的功能。在用户使用这些产品的过程中,研发人员会根据用户反馈不断完善产品的

更多

快讯

三言智创(北京)咨询有限公司企业文化