《拆穿数据胡扯:信息驱动世界的生存指南》封面

内容简介

“用数据说话”是互联网时代的通用思维方式,有人说数据不会骗人,真的是这样吗?

X 让人看不懂的数据分析和神奇算法

X 莫名奇妙的数学方程

X 强行联系因果的统计学论文

X 某些新闻报道或PPT中花里胡哨的图表

……

我们都曾经或正在被这些东西蒙蔽,却往往毫无察觉,甚至乐在其中!

一些貌似可靠的数据来源,也可能藏着一本正经的胡说八道。比如TED演讲中的统计数字、《纽约时报》等媒体报道的大数据分析新算法、甚至是医学期刊中的诊断数据……虚假信息都有可能鱼目混珠,而你能分辨其中哪些是真正有用的信息,哪些只是胡扯吗?

对此,华盛顿大学专门开发了一门尚未开课即爆满的公开课,而这本书正是源自这门引发热议的课程。

两位作者花了多年时间研究打着数学和统计学幌子的胡扯,犀利幽默地对它们分门别类一一剖析,帮助我们培养批判性思维,有效分析海量数据和观点,拆穿无用数据的精致伪装,在信息时代做个游刃有余的明白人。

话说回来,除了教会你如何识别数据胡扯,当你迫不得已需要胡扯时,它也会成为一本实操性强的工具书呢!

作者简介

卡尔·伯格斯特龙(CarlBergstrom)

美国华盛顿大学生物学系教授。他研究流行病如何在人群中传播,以及信息如何大规模地在生物和社会系统中流动——从细胞内对基因表达的控制到社交媒体上错误信息的传播。他最为人所知的是跨界整合自然科学和社会科学思想的能力,特别是在信息研究领域造诣很深。2010年以来,他发表了多篇前瞻性的文章,涉及信息科学、计算机科学、控制论、进化生物学、信息论、科学哲学、物理学等方面。其中有很多都发表在《自然》《科学》《美国国家科学院院刊》上。

杰文·韦斯特(JevinD.West)

美国华盛顿大学信息学院副教授、公众知情中心主任。

目录

推荐序1科学地对抗科学的胡扯的“胡扯”/V
推荐序2拨开扯淡的迷雾/IX
推荐序3闲得没事也别胡扯/XIII
前言/XVII
第1章 胡扯无处不在
惯于欺骗的甲壳类动物和狡猾的乌鸦/003
狡辩之词和律师的语言/008
谎言传千里,真相难出门/012
第2章 媒体、信息和错误信息
印刷厂就是妓院/022
不加渲染的事实宛若凤毛麟角/025
偏见性、个人化和对立/029
错误信息和虚假信息/033
新型造假者/037
第3章 胡扯的本质
胡扯与黑箱/048
刑事机器学习/051
第4章 因果关系
夜晚天空红艳艳,水手脸上笑容现/060
关于因果关系的思考/064
相关性不会增加报纸销量/068
延迟享乐与共同原因/076
伪相关性/078
吸烟不会导致死亡?/083
如果其他方法都行不通,那就人为操控吧/084
第5章 数字与胡扯
提取数字/095
有害的百分比/098
古德哈特定律/106
数学滥用/110
僵尸统计数据/115
第6章 选择偏倚
你看到什么取决于你看的是哪儿/126
隐藏在墨菲定律背后的原因/129
帅哥和顶级程序员/137
音乐才华的致命危险/143
消除选择偏倚/148
第7章 数据可视化
数据可视化的发端/158
鸭子!/162
水晶鞋和丑陋的继姐/166
邪恶的轴/177
比例油墨原理/192
第8章 大数据与胡扯
机器是怎么看到东西的/213
废料进,废品出/219
同性恋雷达和胡扯的结论/221
机器是怎么思考的/226
机器为什么失败/230
第9章 科学的易感性
检察官谬误/242
p值操纵和发表偏倚/251
点击诱饵科学/260
胡扯科学的市场/265
科学为什么有用/271
第10章 辨别胡扯
1.质疑信息来源/278
2.小心不公平的比较/281
3.如果好得或糟糕得不像是真的……/284
4.从数量级考虑/287
5.避免证真偏差/292
6.考虑多个假设/295
辨别网上的胡扯/296
第11章 驳斥胡扯
使用归谬法/306
要让人难以忘记/308
寻找反例/311
使用类比/312
重新绘制图表/314
使用零模型/316
揭穿者心理/319
致谢/329
注释/333
参考文献/349
······

最后修改:2022 年 07 月 13 日