《看穿一切数字的统计学》读后感_1200字_读后感大全

《看穿一切数字的统计学》读后感1200字

小书一本, 偶然翻开. 颇有趣.
..
.
~
[随机对照]
随机对照实验的时代开始于一次家庭主妇与其绅士老公们之间的抬扛.
前者发现 "奶茶中先茶后奶与先奶后茶两者口感完全不同". 后者表示不屑一顾 — 成分比例完全一样嘛!
于是Fisher进行了已知的首次随机对照测试.
结果是, 女人成功通过了全部10杯随机提供的奶茶.
(据后人分析其原因, 当牛奶倒进高温的茶水中, 会发生一系列物理化学变化, 影响口感.)
这个故事告诉我们:
1 经验有时是有效的, 抽象知识经常是错误的.
2 跟老婆抬扛是非常非常愚蠢的– 赢了跪主板, 输了更丢人.
..
.
[计量经济学家]
计量经济学家, 和普通的统计学家的最大区别是, 两者的思维方式差异.
后者是归纳法, 满足于 "证明吸烟和肺癌强关联" 就好;
而前者是演绎法, 看重预测和推论.
于是, "计量经济学家" 十分关注于 "找到更好的模型" — 好的模型是任何有效推论的前提, 而好的前提是透彻了解真实发生机制.
或者说, 统计学家持engineering思维, 满足于解决问题.
而计量经济学家以science为衡量, 希望搞清楚why.
(这也是两者看待 "neural network"对于解决问题及其成果的态度差别. 计量们根本不care.)
..
.
[频率派与贝叶斯派]
在统计学家中, 也分气宗和剑宗 — 频率派与贝叶斯派.
两者的分野主要在, "是否有预先设定的模型" 这件事上.
比如抛硬币. 贝派需要先设定一个 "老千硬币", 与 "真正硬币" 的比例“常识比例”, 然后得出 "真正硬币在有两种硬币的前提下, 出现10把连正的概率是多大" 的答案.
频率派认为这个想法是愚蠢的.
一个推广的问题就是: 我们根本没法给 "上帝是否存在" 这件事, 一个先设概率. 更没法自信的认为, 世间只有两个模型: A 上帝不存在, B上帝存在. 完全可能有CDEFG…
(这事儿我在之前的书评中仔细解释过.)
正因为贝派的使用要求"对全部情况分别假设模型", 人为假设太多太重, 于是在一些 "不容出错" 的领域(比如医疗), 倾向于频率派方法.
而, 在一些探索性较强的领域 (比如广告), 贝派更受计量者们的青睐 — 能提供结果, 有时是一个很大的理由.
..
.
[可信]
统计学乃利器.
但与大多数领域相似, 其中不乏败类.
(比如那些 "研究了几个游戏就的出游戏与未成年犯罪相关结论(且完全不提那些没有影响的游戏)的研究结果".
作者认为, 按照可信程度排序, 依次递增:
1 专家意见 & 基础实验
2 观察研究
3 随机对照试验
4 系统评估 systematic review (或, 荟萃分析 meta-analysis)
systematic review是 "对于众多研究的全局综合评估", 因而具有最高价值.
理由不言而喻: 偏狭 vs 完备 — 数据的, 模型的, 方法的, etc.
..
.
~
统计学是科学么?
Keynes said: ‘I would rather be vaguely right than precisely wrong.’
(是的, 最早是Keynes说, Buffet只是最著名的引用者.)
作者的建议是:
(在投入庞大资源进行数据挖掘以前) 先找到为了正确判断所必须的最少数据.
这是 "完美" vs. "有效" 的取舍. 已经超出了统计学的范畴.
作者没有如很多 "鼓吹大数据或机器学习"者般一味宣扬统计学的好处. 而是阐述其成立条件, 以防被误用. 或因其医学世家, 完美与有效的思考是其毕生的积累.
其中, 频率派与贝叶斯派之争, 值得好好再写一本书, 而不仅仅是一个章节– 这是统计学最吊诡之处.
统计学是科学么?
或许不是, 但无可否认其强大.
但与真相的距离, 往往在于所持视角是否足够全局.
统计学善于解决重复问题. 而在未知面前, 最好保持足够的谦卑, 尤其是手握利器者 — 归纳法永远是不可信的!
again:
"Rational but local know-hows, can be extremely stupid."
..
.
~

最佳范例原创文章,作者:最佳范例网,如若转载,请注明出处:https://www.jiujiushou.com/post/16529.html