
数据获取与存储
|
111
6.5
案例研究
:
数据调查实例
我们将简单介绍几个不同的兴趣领域和问题,这样你可以知道第一步该做些什么。
6.5.1
埃博拉病毒危机
比方说,你对调查西非的埃博拉病毒危机感兴趣。你会怎么开始调查?你可能很快会想到
用谷歌搜索“
Ebola crisis data
”(埃博拉病毒危机数据)。你发现有许多国际组织致力于追
踪病毒的传播,这些组织提供了许多工具,任你使用。首先,你会找到
WHO
的情况报告。
WHO
网站上有关于最新病例和死亡的信息,还有交互式地图显示受影响的地区,以及应
对措施的关键绩效指标,这些内容似乎都是每周更新。数据有
CSV
和
JSON
两种格式,是
真实可靠、定期更新的信息来源。
你要不断挖掘寻找其他可用的资源,而不是在出现的第一个结果这里就止步不前。经过进
一步搜索,我们找到
GitHub
用户
cmrivers
的仓库(
https://github.com/cmrivers/ebola
), 里
面是来自许多政府和媒体数据源的原始数据汇总。由于我们知道该用户,可以通过联系方
式联系到他们,所以我们还可以核实数据最近一次的更新时间,并咨询任何与数据采集方
法有关的问题。我们学过如何处理这些数据格式(
CSV
、
PDF
文件),所以处理起来应该
不成问题。
进一步深入挖掘,你可能会专注于一个具体的问题,比如:“在安全下葬方面采取了哪些
预防措施?”你找到一份由
Sam Libby
(
https://data.humdata.org/user/libbys
)维护的报告,
报告内容是关于安全、庄严的葬礼的 ...