剑客
关注科技互联网

Microsoft 致力于给计算机常识与概念图

Microsoft 致力于给计算机常识与概念图

今天,微软研究院公开发布其努力解决困扰自然语言理解的问题之一 — — 知识。该公司认为背景知识是人类之间的关键分隔符和机器理解语言。

Probase,知识数据库,微软一直在很长一段时间,作为一种新的公共工具,被称为微软概念图的基础。Probase 将 540 万概念到表中,击败其他像 Cyc,提供 120,000 概念的知识数据库。

Microsoft 致力于给计算机常识与概念图

微软研究院的分布的概念图的概念。

所有的连接信息的目标是支持文本分析的混合与概率的解释 — — 这是非常类似的方式人类使用快速的消除过程来完成相同的任务。

例如,如果我说”这个男人跑从陌生人用刀子”,你将最有可能解释这个意思是指这个人在跑从武装的陌生人。但当然这句话也可能意味着你抓住了刀子从陌生人和现在正在奔逃。然而,运行意味着恐惧和刀是恐惧联系在一起的所以最简单、 最直接的、 解释普遍存在 — — 即使它可能不准确。

微软的概念标注模型基础上这来映射断然具有相同概率思想的文本。继续为例,刀可能也指器物或武器,但在上下文,它是最有可能是从博物馆偷来的武器并不是第十七世纪黄油刀。

家庭用具和武器是两个比较常见的类别,但博物馆文物是有点长的尾巴。庞大的规模,由微软的模型认为,都极有可能和极其不可能帐户的属性、 子形式背景和关系。

今天发布的版本可以排名分类关联的任何文本输入。微软的基本层次概念将向旁边其他措施如 MI、 PMI、 PMIk 和典型性的优先等级高效率和适当类别。

未来的版本将能够用来说明他们所称的”单一实例概念与上下文,”这基本上意味着可以连接”陌生人”和”刀”,来表示意义的。甚至更远出,团队希望能解决”短文本概念化”,甚至进一步扩大范围的应用程序内搜索,广告和 AI。

Featured Image: Daniel Grizelj/Getty Images

[剑客-翻译]

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址