N老隆摘自新浪博客
偶然看到一篇文章,叫做《为何茶叶能告诉我们中国的“失踪女性”都去哪儿了》,大致内容介绍了一个学者的最新研究成果,发现“茶叶价格的提高导致了女婴存活率的提高”——问题是:这样的研究真的有意义吗?
第一,你做统计的时候,选择对照了吗?你发现中国茶叶价格与女婴存活率相关,你找到一个反向的例子没有?比如在那些茶叶价格下降的国家,女婴存活率是否也下降了?没有对照,你凭什么认为你得到的结论是可靠的?
经济学研究的特点就在于根本无法找到控制组,历史是不可逆的,像中国这样的高速增长的发展中大国,全球只有一个,你如何能够证明某些结论不是受到其他变量影响的?
第二,现在学者和期刊已经形成了一种默契,认为只有“显著”的才是好的,不“显著”的就是不好。于是,如果有100个学者完成了100个同样的实验,其中有5个发现了显著性,95个未发现显著性,从理论上说,这种显著性是小概率的,不应当被接受。但在实践中,这95个学者会把他们的数据扔进字纸篓,然后去做新的实验,而那5个学者会把数据写成论文,发表在刊物上。
也就是说,我们每天看到的那些数据,都是经过了筛选之后的数据。是在100次实验中只能出现5次的那些结论,但却因为筛选机制而变成了5次实验中出现5次的结论。
这样的计量分析,真的有意义吗?
比如,我观察到吃甜豆腐脑的人比吃咸豆腐脑的人有更强的创业冲动,结论是显著的,数据也很好,可以写文章,于是发表。但我从来不知道,有几百个学者进行过同样的研究,却没有得到这样的显著性,我观察到的显著性,是几百次实验中的一次偶然而已。
这样的结论,真的很棒?
我是教统计课的,我经常在课堂上对学生们说:你们可以这样分析一个问题,这能够让你们的论文得到通过,也可以让你的论文得到发表。但是,你们千万记住,这不是真的,这只是一个数字游戏而已。
离开了人的视角,一切研究不过就是自娱自乐,它不会产生出对人类有价值的知识。
最后说一句,我与茶叶的那位学者素不相识,也没有任何的不敬之意,选择这篇文章来做例子,纯属偶然,我批评的是经济学界。
飞扬南石/文