
194
|
第
9
章
•
腐败感和童工雇用率有什么关系?
对于你的数据集,你会有不同的问题,但是尝试跟随我们的实例,并且找到你想要探索的
趋势。任何统计学上的离群值或者聚合趋势都可以将你引向有趣的问题去研究。
对我们的数据来说,最有趣的问题是,在非洲政府腐败感和童工雇用的关系。政府腐败,
或者政府腐败感,是否会影响社区保护童工不被雇用的能力?
根据所使用的数据集和数据探索结果,你可能会有很多感兴趣、想要探索
的问题。尝试聚焦于一个具体的问题,并用你的分析来回答它。针对多个
具体问题重复这一过程。专注会帮助你找到好的答案,保持你的分析明确
清晰。
回答这个问题需要更多的探索和更多的数据集。我们可能希望阅读更多的文章,看一下在
这个主题上有哪些研究结果。我们可能还希望访问这一领域的专家。最终,我们可能希望
选择非洲的一个特定地区或一系列国家,来更好地评估童工雇用情况。下面这一小节展示
了怎么做这件事。
9.2.1
分离和聚焦数据
为了之后的分析,我们首先需要分离出非洲国家的数据,更加充分地探索这一子集的数
据。我们已经知道了很多使用
agate
库来过滤数据的方式,所以让我们从这里开始。下面
的代码展示了怎样把非洲的数据同其他数据分离开来:
africa_cpi_cl = cpi_and_cl.where(lambda x: x['continent'] == 'africa')
➊
for
r
in
africa_cpi_cl.order_by('Total (%)', reverse=True).rows:
print ...