《暗数据:如何发现被我们忽视的重要信息》封面

内容简介

在大数据时代,我们常常以为自己拥有做出正确决策所需的所有信息。但事实上,我们拥有的信息从来都不完整,可能只是冰山一角。正如宇宙大部分是由暗物质组成的,尽管我们看不见,但它们仍然存在。在信息世界,如果我们忽视暗数据,则可能面临各种风险。

汉德教授以一个引人入胜、充满启迪和智慧的统计学视角总结了15种暗数据类型,并逐一阐释它们的发生机制和可能带来的风险。书中引用大量翔实的案例,这些案例来源于社会生活的方方面面,富含鲜活细节,包括人口普查、火箭发射、总统选举、飓风灾难、地方治安、历史考古、分数膨胀、学术造假、金融诈骗、财务管理等专业领域里的各种案例。汉德教授不仅揭示了深深埋藏在数据背后世界本来的样貌,还提醒要我们警惕未知事物带来的风险,并阐述了如何利用暗数据并从中获益,从而做出理智的决策。

暗数据无处不在。在我们知道的、不知道的每一处角落,暗数据如同一道发自暗处的光,终将照亮人类认知的盲区。

本书将带领我们开启一段奇妙而富有启蒙性的旅程,进入我们看不到的数据世界。

作者简介

戴维·汉德

伦敦帝国学院数学荣誉教授、资深研究员,英国皇家统计学会前主席,英国科学院院士。汉德教授学术成就非凡,曾出版著作7部。

目录

前言/V
第一部分暗数据:原因与结果
第1章暗数据:塑造世界的无形力量/003
幽灵数据/003
你真的拥有全部数据吗?/012
被忽略的“无事发生”/016
暗数据的力量/020
就在我们身边/022
第2章探索暗数据:收集到的与没收集到的/026
来自各方的暗数据/026
数据废气、选择和自我选择/028
以小见大/039
实验数据/051
注意人性的弱点/060
第3章定义与暗数据:你想知道什么?/064
定义差异与错误测量/064
你不能测量所有事物/071
筛查/080
基于过往表现的选择/083
第4章非故意的暗数据:
说一套,做一套/087
大视界/087
汇总/091
人为差错/092
仪器限制/097
连接数据集/099
第5章方略性暗数据:博弈、反馈和信息不对称/102
博弈/102
反馈/109
信息不对称/115
逆向选择和算法/116
第6章故意的暗数据:欺诈与欺骗/126
欺诈/125
身份盗用与网络诈骗/129
个人财务诈骗/133
金融市场欺诈与内幕交易/136
保险诈骗/141
其他欺诈形式/145
第7章科学与暗数据:科学发现的本质/149
科学的本质/149
早知道就好了/154
暗数据碰出新世界/162
暗数据打开大视野/164
隐瞒事实/177
撤回/192
出处和可信度:谁告诉你的?/194
第二部分阐明和使用暗数据
第8章处理暗数据:让光照进来/
希望/201
在已观测数据与缺失的数据之间建立关联/202
识别数据缺失机制/211
利用已有数据开展工作/212
超越数据:如果你先死怎么办?
超越数据:插补/221
迭代/227
错误数据/230
第9章从暗数据中获益:重构问题
隐藏数据/236
对自己隐藏数据:随机对照试验/237
可能发生的事/239
复制的数据/243
想象的数据:贝叶斯先验性/249
隐私与机密保护/251
从暗处收集数据/259
第10章暗数据分类:走出迷宫之路/263
暗数据分类法/263
启示/270
译者后记发自暗处的光/279
参考文献/285
······

最后修改:2022 年 09 月 27 日