您的位置:首页 > 苹果之家 > 资讯

揭秘谷歌翻译背后的技术突破:序列到序列学习

2016-12-29 19:33:45 来源:骑士 编辑:混沌巡洋舰评论

A-A+

我们都知道并且喜欢使用Google翻译,这个网站可以瞬时翻译100种不同的人类语言,就好像有魔法一样。他甚至存在于我们的手机和智能手表上面。

Google翻译背后的科技被称为机器翻译。它改变了世界,在本来根本不可能的情况下让(不同语言的)人们完成了沟通。

但我们都知道,在过去的15年里,高中学生已经使用Google翻译...额...协助他们完成他们的西班牙语作业。这已经不是新闻了…?

揭秘谷歌翻译背后的技术突破:序列到序列学习

事实证明,在过去两年,深度学习已经完全改写了我们的机器翻译方法。那些对语言翻译一无所知的深度学习研究人员正在利用一个个相对简单的机器学习解决方案,来打败世界上最好的专家建造的语言翻译系统。

这一突破背后的技术被称为序列到序列学习sequence to sequence learning。这是一项非常强大的技术,被用于解决许多种类的问题。在我们看到它如何被用于翻译之后,我们还将学习这个算法是怎样用来编写AI聊天机器人和描述图片的。

我们开始吧!

让计算机翻译

那么我们该如何编写代码,才能让计算机翻译人类的语言呢?

最简单的方法,就是把句子中的每个单词,都替换成翻译后的目标语言单词。这里有一个简单的例子,把西班牙语逐字翻译成英语:

揭秘谷歌翻译背后的技术突破:序列到序列学习

我们只是用匹配的英语单词替换每个西班牙单词。

这很容易实现,因为你所需要是一本字典来查找每个单词的翻译。但结果并不好,因为它忽略了语法和上下文的联系。因此,下一件你可能要做的事,就是开始添加特定语言规则以改进结果。例如,你可能将两个常用词翻译为词组。你可能互换名词和形容词的顺序,因为他们在西班牙语中以相反的顺序出现:

揭秘谷歌翻译背后的技术突破:序列到序列学习

这真的有效!如果我们就继续添加更多的规则,直到我们可以应对每一部分语法,我们的程序应该就能够翻译任何句子了,对吧?这就是最早的机器翻译系统的工作原理。语言学家提出了许多复杂的规则,并逐一编程实现。一些世界上最聪明的语言学家在冷战期间辛勤努力了多年,才创建出了一些更容易理解俄罗斯人交流的翻译系统。

不幸的是,这种套路只对简单问题适用,比如说像天气预报这样结构简单的文档。它对于真实世界的文字来说并不可靠。问题是,人类语言并不总是遵循固定的规则。人类语言充满了各种特殊情况,区域差异,或者干脆就不按套路出牌(#

下一条:iOS限免App精选:Warp Shift - 立体迷宫解谜游戏(

上一条:苹果Siri功能进步:应对紧急状况更智能

  • 收藏
  • 纠错
  • 投稿