
xiii
前言
欢迎打开这本书。在本书中,我们将会让你的数据处理技术更上一层楼,不再只是使用
电子表格,而是可以利用
Python
编程语言,将噪声数据轻松快速地转换成可用的报告。
Python
语法简单,上手很快,人人都可以用
Python
编程。
想象一下,你每周都要手动重复同一过程,比如从多个来源复制数据并粘贴到一个电子表格
中,用于后续处理。这项任务可能每周都需要花费一两个小时。但当你用脚本把这项任务自
动化之后,它可能只需要
30
秒就可以完成!这会节省你的时间,让你做点其他事情,或者
把更多的任务自动化。再想象一下,之前你无法处理某种格式的数据,但你现在能对数据进
行格式转换,完成之前无法完成的任务。但在完成本书的
Python
练习后,你应该可以更有
效地从之前认为不可用的数据(过于混乱,或者数据量过大)中采集信息。
我们将带领你完成数据获取、数据清洗、数据呈现、数据规模化和自动化的过程。我们的
目标是教你学会轻松处理数据的方法,这样你就可以花更多的时间专注于内容和分析。我
们将克服现有工具的局限,将手动处理过程替换为简洁、易读的
Python
代码。读完这本书
后,你能够将数据处理过程自动化,定期执行文件编辑和清洗任务,获取并解析你之前无
法获取的数据,还能处理数据量更大的数据集。
采用基于项目的方法,每一章的复杂度会逐渐增加。我们建议你跟随本书的节奏,将书中
的方法应用到自己的数据集上。如果你没有一个特定的项目或研究,也可以使用本书线上
的样本数据集。
目标读者
本书针对的是那些不想用桌面工具来探索数据处理的人。如果你精于 ...