剑客
关注科技互联网

技术揭示了机器学习系统决定的依据

技术揭示了机器学习系统决定的依据

来自麻省理工学院的计算机科学和人工智能实验室 (CSAIL) 的研究人员已经发明了一种来训练神经网络,他们的预测和分类不仅提供理由为他们的决定。信用︰ 陆恭尼古拉斯及麻省理工学院

近年来,人工情报研究中的表现最佳系统有出自神经网络,寻找产生有用的预测或分类的训练数据中的模式。认识到数字图像中的某些对象或推断出的主题文本,可能,例如,训练一个神经网络。

但神经网络黑箱。培训结束后,网络可能很擅长分类数据,但即使是它的创作者都不知道为什么。与数据可视化,它有时候是可以自动确定一个神经网络响应的视觉功能的实验。但文本处理系统倾向于更加不透明。

实证方法在自然语言处理计算语言学会议协会,来自麻省理工学院的计算机科学和人工智能实验室 (CSAIL) 的研究人员将目前 trainneural 网络的新途径,他们的预测和分类不仅提供理由为他们的决定。

“在实际应用中,有时人们真的想要知道为什么模型做出的预测,”说陶雷,麻省理工学院的研究生电气工程和计算机科学和新论文第一作者。”医生不信任机器学习方法的一个主要原因是,目前没有证据表明”。

“它不是只有医学领域,”添加 Regina Barzilay、 三角洲电子教授的电气工程和计算机科学和雷的论文导师。”这是在制造错误预测的成本是非常高的任何域中。你需要证明你这么做的原因。

“一个更广泛的方面,对这项工作,以及”车手 Jaakkola,麻省理工学院电气工程和计算机科学的教授和第三个合作者在纸上的说。”你可能不想要只需验证该模型以正确的方式; 使预测你也可能想要发挥一些类型的它应该作出的预测的影响。一个普通人与一个复杂的模型,采用他们一无所知的算法进行训练如何沟通?他们也许能够告诉你关于一个特定的预测的理由。在这个意义上,它开辟了沟通与模型的一种方式”。

虚拟的大脑

神经网络如此称呼是因为他们模仿 — — 大约 — — 大脑的结构。它们是由组成大量的处理节点,像单个神经元,有的只是很简单的计算能力,但密集网络互相连接。

在被称为”深度学习”的过程中,训练数据是喂给网络输入节点,对其进行修改和饲料到其他节点,修改它,喂它,还是其他的节点,等等。网络的输出节点中存储的值然后随网络正在试图学习的分类类别 — — 如图像或主题的一篇文章中的对象。

网络的训练,当然,各个节点所执行的操作是不断的修改,以产生一贯良好结果的一整套训练示例。年底的过程,经常进行网络编程的计算机科学家也不知道节点的设置是什么。即使他们这样做,它可以很难翻译,低级信息反馈到系统的决策过程的理解说明。

在新的文件,Jaakkola、 Barzilay,雷专门解决神经网络训练对文本数据。若要启用解释一个神经网络决定,CSAIL 研究人员分为网两个模块。第一个模块从训练数据中提取文本段和段根据它们的长度和其一致性得分︰ 越短的部分和更多的是从字符串的连续绘制词语,越高其得分。

选定的第一个模块的段然后传递给第二个模块,执行预测或分类任务。模块在一起,训练和培训的目标是要最大限度地提取部分的分数和预测或分类的准确性。

数据集的研究人员测试他们的系统之一是从用户那里评估不同的啤酒网站点评一组。该数据集包括原始文本的评论和相应的评级,使用一个五星级的系统,每个三个属性︰ 香气、 口感和外观。

让数据对自然语言处理研究人员有吸引力的是,它也已注释用手示意在审查中的哪些句子对应的分数。例如,审查可能包含八个或九个句子和注释器可能会突出显示那些啤酒的”棕褐色头约半英寸厚,”是指”签字吉尼斯的气味,”和”缺乏碳化”。每个句子的不同属性等级密切相关。

验证

因此,数据集提供优秀的测试,CSAIL 研究者的系统。如果第一个模块已提取那些三个短语,和第二个模块的有相关的正确的评级,然后系统已标识相同的人类的注释器做的判断依据。

在实验中,与人类的批注系统协议 96%和 95%,分别是,为了收视率的外观和香味,口感更模糊概念的 80%。

在本文中,研究人员也报告测试他们的系统上数据库的形式自由技术问题及答案,在这里的任务是确定是否给定已经回答过以前。

在发表的作品,他们已经应用于数以千计的病理报告对乳腺癌活检,在那里,它学会了提取文本解释为病理学的诊断依据。他们甚至用它分析乳腺钼靶检查,在那里的第一个模块提取的图像部分,而不是文本段。

[剑客-翻译]

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址