剑客
关注科技互联网

[译]谷歌释放神经翻译机器语言深度学习科技

谷歌释放神经翻译机器语言深度学习科技

从一种语言翻译到另一种是硬的和创建一个自动的系统是一项重大挑战,部分是因为有这么多的单词,短语和规则来处理。幸运的是,神经网络早饭吃大、 复杂的数据集。谷歌一直在一种机器学习翻译技术,多年来,和今天是正式亮相。

谷歌神经的机器翻译系统,对于中文英文查询,今天部署是步了复杂性从现有的方法。这里是如何事情就这样一句话演变。

词的词和短语的短语

一个非常简单的技术,为翻译 — — 一个孩子或简单的计算机能做 — — 会简单地查找所遇到的每个单词和切换另一种语言中的等效的单词。当然,语言的细微差别和经常的话语含义可能会丢失,但这简陋的词对词系统仍然可以传授的要点在最少的麻烦。

相关的文章

Machine learning could automate screening kids for speech and language disorders
Scientists teach machines to hunt and kill humans — in Doom deathmatch mode
Google’s WaveNet uses neural nets to generate eerily convincing speech and music

因为语言是自然基于短语,逻辑的下一步就是学会尽可能多的这些短语和半正式的规则,以及应用这些。但它需要大量的数据 (不只是德语-英语词典) 和严重的统计排骨,要知道的区别,例如,”跑完一英里,”的”运行测试”和”运行存储区”。计算机都很擅长,但一旦他们接管了,基于短语的统计翻译成为了常态。

当然,更多复杂性潜伏仍在其余的句子,但它是另一个跳跃在复杂性、 微妙之处和解析它所需的计算能力。摄取复杂的规则集并使预测模型是神经网络,专业和研究人员正在把这种方法,但谷歌有殴打他人先发制人。

GNMT 是最新的到目前为止最有效的方法成功地实现利用机器学习在翻译。看来,在这句话作为一个整体,同时铭记,这么说,更小的片段,像单词和短语。

谷歌释放神经翻译机器语言深度学习科技

谷歌的动画显示了如何检测一句中文的部分,他们与字要翻译的相关性重 (蓝线)。

这很像我们看一张图片作为一个整体同时认识到各自的片断的方式是 — — 这并不是一个巧合。有训练神经网络识别图像及方式模仿人类感知的对象,还有更多比之间找到图像的完形和那句非常相似。

有趣的是,很少在那里实际上特定于语言︰ 系统不知道未来连续与未来的完美的区别,它不分手基于其词源学的单词。它是所有的数学和统计,没有人性。减少到机械任务翻译是令人钦佩,但在方式令人不寒而栗 — — 尽管无可否认,在这种情况下,机械翻译只不过要求,而手腕和解释都是多余的。

通过删除艺术推进艺术

本文描述了 GNMT 指出了若干进展 — — 而是技术性的 — — 减少计算开销处理所需的语言这种方式,避免其陷阱。

例如,系统往往噎常见的单词,因为他们的稀有使他们难于识别和与其他词相关联。GNMT 获取周围这生僻的单词分解成更小的片段,它对待作为单个字和学协会。

实际的计算时间减少限制涉及的数学精度和使用谷歌的张量加工单位,自定义硬件设计的神经网络训练的头脑。

输入和输出系统是非常不同的但仍然交换信息他们的接口,允许他们到一起训练,形成更加统一的进程在外。这就是具体我可以相处的那一个;细节都在本文,如果你认为你可以处理它们。

所得到的系统是质量的高度准确的跳动基于短语的统计翻译和接近人类水平。你知道它必须要很好,当谷歌只是将其部署到其公共网站和应用程序的一个艰难的过程,像中文到英文。

谷歌释放神经翻译机器语言深度学习科技

西班牙语和法语也很好,测试,你可以期望 GNMT 在这几个月的方向扩张。

黑箱

缺点之一是,与这么多的预测模型,通过机器学习产生,我们真的不知道它是如何工作。

“GNMT 就像其他的神经网络模型 — — 一大组的参数,经过培训,难以探测,”谷歌 Charina 财告诉 TechCrunch。

它不是,他们根本不清楚,但基于短语的统计翻译许多移动部件都由人设计的并当一块出错或变得过时,它可以被交换出去。因为神经网络本质上是设计自己通过数以百万计的迭代,如果出了什么差错,我们不能达到中和替换的部件。培养一个新的系统不是琐碎的虽然它可以很快完成 (和可能会定期做所改进的设想的)。

谷歌大赌机器学习和此翻译工具,现在活在 web 和移动查询,也许是该公司的大部分公共示范尚未。神经网络可能是复杂、 神秘,而且有点令人毛骨悚然,但很难认为它们的效力。

Featured Image: razum / Shutterstock

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址