剑客
关注科技互联网

标签:支持向量机

技术教程

不平衡数据的数据处理方法

阅读(17)评论(0)

在机器学习中,不平衡数据是常见场景。不平衡数据一般指正样本数量远远小于负样本数量。如果数据不平衡,那么分类器总是预测比例较大的类别,就能使得准确率达到很高的水平。比如正样本的比例为 1%,负样本的比例为 99%。这时候分类器不需要经过训练,...

技术教程

使用Python画ROC曲线以及AUC值

阅读(131)评论(0)

AUC (Area Under Curve)是机器学习二分类模型中非常常用的评估指标,相比于 F1-Score 对项目的不平衡有更大的容忍性,目前常见的机器学习库中(比如 scikit-learn )一般也都是集成该指标的计算,其计算原理可...

技术教程

统计学习那些事儿

阅读(130)评论(0)

本文作者杨灿于2011年在香港科技大学电子计算机工程系获得博士学位,2011-2012为耶鲁大学生物统计系博士后,2012-2014耶鲁大学副研究员。2014至今为香港浸会大学数学系助理教授。本文写于作者博士毕业之际。

技术教程

机器学习系列:(九)从感知器到支持向量机

阅读(90)评论(0)

上一章我们介绍了感知器。作为一种二元分类器,感知器不能有效的解决线性不可分问题。其实在第二章,线性回归里面已经遇到过类似的问题,当时需要解决一个解释变量与响应变量存在非线性关系的问题。为了提高模型的准确率,我们引入了一种特殊的多元线性回归模...