剑客
关注科技互联网

微软的语音识别技术是正式和人类一样精确

“人类平等”实现

发表最后一个星期一,预示着作为一个历史性的成就,微软的一项研究详细介绍了新的语音识别技术,能够录制会话演讲以及人类 — — 或至少,作为最佳作为专业的人类转录 (这是比大多数人更好)。

技术得分误码字率 (WER) 的 5.9%,也低于疫情周报 》 报道只是上个月的 6.3%。”[I] 细节最低有史以来对行业标准的总机语音识别任务,”Microsoft 的报告。率是相同的 (或甚至低于) 人类的专业转录转录同一次交谈的人。

黄学东,微软的首席演讲科学家说:”我们已经达到人类的奇偶校验,”。新技术使用允许更有效的推广,将类似的词组合在一起的神经语言模型。

成就是几十年后在 20 世纪 70 年代首次研究了语音模式识别。与谷歌的 DeepMind 波在语音和图像识别 (和说话像人类一样),这项技术是微软的及时贡献快节奏人工智能 (AI) 的研究和发展。

成就是解锁使用计算网络工具包,微软自主开发系统的深度学习。

下一步︰ 理解

新技术的应用程序绑定来改善用户体验微软的个人语音助理为 Windows 和 Xbox 一。兴奋的 Harry Shum,标题微软人工智能和研究集团的副总裁说:”这将使柯塔娜更加强大,使得一个真正智能的助理,”。当然,它还将发展更好的语音文本转录软件。

微软的语音识别技术是正式和人类一样精确

Credits:
The Verge

然而,微软澄清,奇偶校验并不意味着完美。计算机不承认每一个字很明显,这是连人类完全能做点什么 (也可以 Siri 或其他现有的语音助理)。

因为它是令人印象深刻,还有改进的余地。下一个目标︰ 使计算机理解人类的谈话。杰弗里 · 茨威格、 言语与对话框研究组经理说:”下一个前沿领域是从识别移动到理解,”。

[剑客-翻译]

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址