剑客
关注科技互联网

和张公子比比赞同数

和张公子比比赞同数

这是本专栏的第 17 篇日记

截止我开始动手写这篇文章,我的赞同数是40293,张公子@张佳玮 的赞同数是2637024,绝对差距近260万,相对差距是65.45倍。不管从哪个角度看,都是被张公子完虐的节奏。(唯一超过张公子的大概就是我是两个话题的优秀回答者,而张公子只有一个(笑))

比赞同数这种事情,当然不止发生在知乎上。科学界也喜欢比“赞同数”,当然他们没有科学界专用版本的知乎,这里的“赞同数”实际上指的是另一项指标: “论文被引用次数”

科学家是怎么通过这一指标来比较不同的学者的呢? 比较总被引用次数 是一种办法,但是这种办法在某些情况下未必符合我们的直觉;举个极端的例子,比如一个学者写了2000篇论文,每篇只有10引用,而另一个学者写了1篇论文,但是这篇论文有19999引用,前者的总引用次数比后者多一丁点,但是我们一般都会觉得后一位学者对学科的贡献要更大一些。换句话说,总被引用次数是和论文的数量与质量同时相关的指标,但数量和质量之间并不是完全替代的,事实上我们会更加注重质量超过数量。

为了解决这个问题,熟悉科学界的童鞋们肯定知道有一个概念叫 “h-index” :如果某个学者 有h篇论文的引用数量达到至少h次 ,那么这位学者的h-index就是h。作为类比,@曾加 去年曾经拿小号偷偷地搞过一个大新闻: 如何拿到知乎用户H-index的排名? – 互联网 ,用h-index(和推广的h-10/h-100/h-1000/h-10000指数)给顶层的知乎用户们排了个座次。

h-index这个指标最早由Hirsch在2005年的论文“ An Index to Quantify an Individual’s Scientific Research Output "中提出,距今也不过十余年时间。虽然它听起来很有道理,但是它(以及其它同类的指标)都有一个重大的缺陷,那就是 依赖于直觉和经验,而没有得到充分的justification 。因此,h-index存在一些问题也就不足为奇了:

首先,h-index对于发表论文数较少的学者不利,就以上面我们举的那个极端例子来说,第一位学者的h-index是10,而第二位只有1,原因是第二位学者只有这一篇论文,所以h-index的结论还是和我们的感受相悖。作为修正,@曾加 采用的是h-100这样的指标,即“有h篇回答获得了至少100h的赞同”,而科学界的做法其实也很类似,Egghe在其2006年的论文中就提出了改进h-index的 g-index ,即“ 有g篇论文获得了至少g^2次引用 ”。尽管采用修正的指标后,极端例子中的两位学者之间的差距迅速缩小,但是这并没有从本质上解决发表论文数较少的学者处于劣势的问题。

其次,为了比较不同学科的学者,必须对引用数做re-scale,因为不同学科的论文平均被引用次数可能不尽相同,例如数据表明,生物学论文中达到100次引用的论文占比就是航空工程论文的50倍。然而,h-index这个指标 对于具体的引用次数是敏感的 ,结果是在re-scale前后,可能会出现 学者的排序逆转 的情况。举个假设的例子,现在有两个宏观经济学家A和B,他们各自发表了3篇论文,引用数分别是(8、9、10)和(1、20、30),这时候A的h-index是3,而B的h-index数是2;我们再假定宏观经济学论文的平均被引用次数是100;现在我们要把A和B拿来和一个产业组织理论经济学家C进行比较,而产业组织理论论文的平均被引用次数假定是10,那么就得把A和B每篇论文的数目除以10,新的引用数变成了(0.8、0.9、1)和(0.1、2、3),A的h-index只有1了,而B的h-index仍然是2。也就是说,引入一个新的学者对原有学者的顺序造成了变化,这显然不是一种合意的性质。

(所以说,我和张公子的比较还得考虑到篮球话题和经济学话题的平均赞同数才对嘛~!)

那么,如果不用h-index,我们又该用什么指标呢?答案其实比你想像的要简单:我们用Euclidean Index,也就是 将这个学者发表的所有论文的被引用次数视为一个坐标,计算这个坐标到原点的欧几里德距离 。听起来简单粗暴,但是这个指标比h-index要靠谱得多:发表于上个月的American Economic Review中的论文" How to Count Citations If You Must "中(这是论文地址: http:// pubs.aeaweb.org/doi/pdf plus/10.1257/aer.20140850 ),作者Motty Perry和Philip J. Reny给出了五条恰当选择的性质,Euclidean Index(及其单调变换)是 唯一 满足全部性质的指标。 (其实我不太明白为什么经济学顶刊会发一篇这样的论文……)

这五条性质分别是:

(1) 单调性(Monotonicity) :新增一篇被引用次数充分多(判断充分多的标准取决于原有的论文)的论文,指标不会降低。

实际上,单调性可以加强为“新增一篇论文, 无论引用次数多少 ,指标都不会降低”;注意单调性讨论的是新增一篇论文的情况,而不是现有的论文引用次数增加。

(2) 独立性(Independence) :给两位学者同时新增一篇被引用次数同样多的论文,指标的相对大小不发生改变。

h-index就不满足独立性,比如A有10篇论文各10引用,B有5篇论文各15引用,现在给两人增加10篇15引用的论文,每增加一篇,A的h-index始终保持10,而B的h-index就从5不断上涨到15。

(3) 深度相关性(Depth Relevance) :如果将一篇论文替换成总引用次数相同的两篇论文,指标将 严格 下降。

这条性质体现了我们看重质量胜过数量。

(4) 尺度不变性(Scale Invariance) :如果将两位学者所有论文的被引用次数乘以同一个正的常数,指标的相对大小不发生改变。

这条性质避免了比较不同学科的re-scale的影响。

(5) 方向一致性(Directional Consistency) :如果两个学者去年的指标相同,今年两人都新增了同样多的引用之后指标仍然相同,那么明年再增加同样多的引用,两人的指标仍然相同。

这个性质是唯一一条看起来很tricky的性质,举例说明一下:比如说去年两个学者各自发表了3篇论文,分别获得了a=(a1, a2, a3)和b=(b1, b2, b3)次引用,去年两人的指标相同;今年两人都新增了同样多的引用d=(d1,d2,d3,d4)(注意d4代表了一篇新论文),因此分别有(a1+d1, a2+d2, a3+d3, d4)和(b1+d1, b1+d2, b1+d3, d4)次引用,今年两人的指标还是相同;那么,明年如果两人又新增了d=(d1,d2,d3,d4)次引用,明年两人的指标必然还是相同的,甚至对于任意常数c>1,两人分别有a+cd和b+cd次引用时,指标仍然是相同的。

(实际上作者还要求了第六条性质,即 连续性(Continuity) :如果两位学者发表了同样多的论文,被引用次数构成的两个坐标之间距离充分近时,对应的指标之差充分小;这里的距离不一定要是欧几里德距离,也可以是曼哈顿距离等等)

通过一系列推导作者证明了, Euclidean Index,即以引用次数为坐标的点到原点的欧几里德距离 和张公子比比赞同数 (及其所有单调变换,比如 和张公子比比赞同数 )是唯一满足上述全部五条(其实是六条)性质的指标 ,而且这五条性质中不存在冗余(换言之也就不能相互证出),放弃任意一条性质都不能保证唯一性,比如:

放弃单调性:

放弃独立性: 和张公子比比赞同数

放弃深度相关性: 和张公子比比赞同数

放弃尺度不变性: 和张公子比比赞同数

放弃方向一致性: 和张公子比比赞同数

放弃连续性:字典序

好了,最后我们也来移植一下,这是博弈论话题下的活跃回答者名单:博弈论-活跃回答者,我们尝试算一下Euclidean Index和h-index:

@Manolo (1261, 810, 452, 273, 238, 62, 49, 49, 43, 25, 15, 14, 8, 7)

EI = 1610.389

h-index = 12

@长泽雅美 (105, 64, 52, 43, 28, 25, 18, 15, 15, 13, 12, 2)

EI = 148.9094

h-index = 11

@晓风残月 (237, 166, 124, 55, 48, 43, 42, 36, 8, 6, 4, 1, 1)

EI = 330.8429

h-index = 8

@前锋TX (140, 129, 117, 61, 50, 22)

EI = 237.9811

h-index = 6

我自己 (467, 228, 39, 33, 26, 21, 17, 15, 14, 14, 13, 12, 11*4, 10, 9, 8, 7*3, 6*4, 5*3, 4*9, 3*10, 2*6, 1*11, 0 ) (一看就是我最水……)

EI = 525.7214

h-index = 12

@荣健欣 (119, 103, 54, 32, 20, 16)

EI = 171.3651

h-index = 6

@慧航 (485, 231, 96, 30, 16, 8, 7)

EI = 546.8738

h-index = 7

@陈茁 (125, 110, 103, 47)

EI = 201.3529

h-index = 4

@胖子邓 (462, 106, 106)

EI = 485.7118

h-index = 3

@曾加 (7944, 295) (要不我偷偷地去把豆子那道题的博弈论标签给去掉……)

EI = 7949.476

h-index = 2

@Lindisfarne (1246, 77, 25, 6)

EI = 1248.642

h-index = 4

@董可人 (438, 42, 24)

EI = 440.6631

h-index = 3

从这个结果来看,感觉直接应用过来还是有点问题的……因为比较的是在博弈论话题下的回答,而且博弈论是比较细分的话题(不像“经济”话题下面林子大了什么鸟儿都有),也就大致可以认为相当于“同一学科的论文”,本来应该是不用re-scale的;但是考虑到曾加拿到近8000赞的那个回答,也许还是按照每个问题的平均赞同数re-scale一下比较好呢……毕竟每个问题不止有一个话题,所以可能受到几个话题标签的共同影响也说不定呢……

(Photo Credit: " thumbs up " viaVisualhunt)

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址