Skip to Content
数据驱动力:企业数据分析实战
book

数据驱动力:企业数据分析实战

by Carl Anderson
April 2021
Intermediate to advanced
210 pages
6h 3m
Chinese
Posts & Telecom Press
Content preview from 数据驱动力:企业数据分析实战
36
3
3.5
 购买数据
虽然组织的内部数据系统本身往往就含有大量信息,但我们仍可以从开放数据中得到补
充。有时候你可以从第三方购买额外数据。
购买额外数据集的理由有很多。前文用
Belinda
Smith
购买阳台家具的案例说明了场景的重
要性。首先,合伙人、供应商甚至政府机构就拥有一些能为你提供场景、给你的拼图添加
“相邻碎片”的数据。其次,即使你有内部数据,但第三方可以提供更大量或更高质量的
数据。
有时候你在购买数据时可能没有多少选择,比如
MLS
实际
垄断了住房销售数据。一般说
来,数据的提供市场存在直接竞争。
面临资源的选择时,比如将邮编映射到大都市区的数据集,还需要考虑多个维度,示例如下。
价格
分析师和领导层都喜欢免费的东西,可是通过付费获取更高质量的数据是更好的做法。
你需要考虑数据的价格是否公道,以及它给组织带来的价值。
3.6
节将详谈该维度。
质量
数据的干净程度和可靠性如何?
排他性
这个数据集是不是专属、排他的数据集?如果使用得当,能否给你带来超越竞争对手的
优势?
样本
你能否获得一个样本,以便在最终决定前可以审核数据,充分地判断数据的内容、质量
和格式?
更新
数据发生变化、过时或变得无关的速度如何?数据的更新频率如何?
可靠性
调用
We
b
服务
API
时,其可用时间有多久?
API
调用或其他服务水平的协议是否存在
限制?
安全性
如果数据很敏感,那么它是否被加密且安全地传输?
使用条款
是否有任何许可条款或限制会制约从数据中可获得的价值?
数据收集
37
格式
虽然每个人有不同的数据格式偏好,但它们通常都是人类可读的格式 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Java数据科学实战

Java数据科学实战

Michael R. Brzustowicz, PhD
精通模块化JavaScript

精通模块化JavaScript

Nicolás Bevacqua

Publisher Resources

ISBN: 9787115560179