
236
|
第
7
章
从严格意义上讲,你没有数据的所有权。如果数据提供者决定取消你对数据集的访问权
限,你将无法访问它。
许多云平台提供数据共享,允许你分享你的数据的同时也消费来自不同提供商的数据。
其中一些平台还提供数据市场,以便部分公司或组织可以进行数据销售。
7.6
你和谁一起工作
数据获取位于不同组织的边界。在开发和管理数据获取管道时,数据工程师将同时与上
游(数据生产者)和下游(数据消费者)的人员和系统合作。
7.6.1
上游利益相关者
负责
生成数据
的人
—
通常是软件工程师
—
与为分析和数据科学准备这些数据的数据
工程师之间往往存在着明显的脱节。软件工程师和数据工程师通常位于不同的组织中。
软件工程师通常会把数据工程师简单地看作应用程序生成数据的下游消费者,而不是利
益相关者。
我们认为这种现状是一个问题,同时也是一个机遇。数据工程师可以通过邀请软件工程
师成为数据项目成果的利益相关者来提高数据质量。绝大多数的软件工程师都很清楚分
析和数据科学的价值,但不一定有动机直接为数据工程工作做出贡献。
简单地改善沟通是关键的第一步。通常情况下,软件工程师已经清楚地知道哪些数据对
下游最有价值。建立沟通渠道可以鼓励软件工程师将数据变成消费者需要的形态,并就
数据的变化进行沟通,以防止数据管道出问题。
除了沟通,数据工程师还可以向团队成员、管理层,特别是产品经理强调软件工程师的
贡献。让产品经理参与到结果中来,并将下游数据处理作为产品的一部分,鼓励他们将
稀缺的软件工程师分配到与数据工程师的合作中来。理想情况下,软件工程师可以部分 ...