剑客
关注科技互联网

标签:向量

技术教程

不平衡数据的数据处理方法

阅读(17)评论(0)

在机器学习中,不平衡数据是常见场景。不平衡数据一般指正样本数量远远小于负样本数量。如果数据不平衡,那么分类器总是预测比例较大的类别,就能使得准确率达到很高的水平。比如正样本的比例为 1%,负样本的比例为 99%。这时候分类器不需要经过训练,...

技术教程

机器学习与Dota2英雄属性

阅读(100)评论(0)

本文使用自然语言处理(NLP)方法对DOTA2 英雄角色属性做了简要的分析。 如果有人问你“兔子”是什么意思,你会怎么回答?你可能会跑出去,每次看到一只兔子就指给那个人看,说“喏,那就是兔子。”当然那个人得和你三观相近,你才能解释得通。那如...

技术教程

最小二乘法小结

阅读(73)评论(0)

作者:刘建平Pinard 原文链接: 最小二乘法小结 最小二乘法是用来做函数拟合或者求函数极值的方法。在机器学习,尤其是回归模型中,经常可以看到最小二乘法的身影,这里就对我对最小二乘法的认知做一个小结。

技术教程

漫谈词向量

阅读(93)评论(0)

作者:Sebastian Ruder 译者:KK4SBB 审校: 王艺 责编:何永灿,关注人工智能,投稿请联系 heyc@csdn.net 或微信号 289416419

技术教程

浏览器插件的攻击向量

阅读(140)评论(0)

*本文原创作者:Black-Hole,本文属FreeBuf原创奖励计划,未经许可禁止转载 。我在很多地方都有说“浏览器插件的攻击方法”,本篇文章就带大家深入的研究一下“由浏览器插件引发的攻击手法及攻击代码”。本篇文章说的内容,可以给大家打开...

技术教程

cs.CL weekly 2016.10.03-2016.10.07

阅读(100)评论(0)

本文针对encoder-decoder框架在应用时无法控制生成序列长度(比如文本摘要)的问题,作者提出了一种基于学习的模型来解决这个问题。encoder-decoder框架已经被成功应用于各大任务中,加上attention,不同变种的att...

技术教程

PaperWeekly 第八期

阅读(78)评论(0)

SIGDIAL是ACL所属的关于对话系统的兴趣小组,SIG的文章针对性比较强,但文章的质量良莠不齐,本期给大家精心挑选了4篇SIGDIAL 2016的文章,带着大家一起来看看对话系统最新的研究成果。4篇文章分别是:

技术教程

深度学习解决机器阅读理解任务的研究进展

阅读(244)评论(0)

关于阅读理解,相信大家都不陌生,我们接受的传统语文教育中阅读理解是非常常规的考试内容,一般形式就是给你一篇文章,然后针对这些文章提出一些问题,学生回答这些问题来证明自己确实理解了文章所要传达的主旨内容,理解地越透彻,学生越能考出好的成绩。

技术教程

深入浅出搜索原理系列之(三)相关性算法

阅读(112)评论(0)

我们知道文本搜索中,召回率和准确率是很重要的两个指标,但是返回文档的 相关性 也很重要,这直接影响到返回文档集的优先顺序。最近在看ElasticSearch5.0(还是Alpha版),发现其基于的Lucene也升级到了6.X版本,重大变化之...