Skip to Content
数据工程之道:设计和构建健壮的数据系统
book

数据工程之道:设计和构建健壮的数据系统

by Joe Reis, Matt Housley
February 2024
Intermediate to advanced
370 pages
7h
Chinese
China Machine Press
Content preview from 数据工程之道:设计和构建健壮的数据系统
236
|
7
从严格意义上讲,你没有数据的所有权。如果数据提供者决定取消你对数据集的访问权
限,你将无法访问它。
许多云平台提供数据共享,允许你分享你的数据的同时也消费来自不同提供商的数据。
其中一些平台还提供数据市场,以便部分公司或组织可以进行数据销售。
7.6
你和谁一起工作
数据获取位于不同组织的边界。在开发和管理数据获取管道时,数据工程师将同时与上
游(数据生产者)和下游(数据消费者)的人员和系统合作。
7.6.1
上游利益相关者
负责
生成数据
的人
通常是软件工程师
与为分析和数据科学准备这些数据的数据
工程师之间往往存在着明显的脱节。软件工程师和数据工程师通常位于不同的组织中。
软件工程师通常会把数据工程师简单地看作应用程序生成数据的下游消费者,而不是利
益相关者。
我们认为这种现状是一个问题,同时也是一个机遇。数据工程师可以通过邀请软件工程
师成为数据项目成果的利益相关者来提高数据质量。绝大多数的软件工程师都很清楚分
析和数据科学的价值,但不一定有动机直接为数据工程工作做出贡献。
简单地改善沟通是关键的第一步。通常情况下,软件工程师已经清楚地知道哪些数据对
下游最有价值。建立沟通渠道可以鼓励软件工程师将数据变成消费者需要的形态,并就
数据的变化进行沟通,以防止数据管道出问题。
除了沟通,数据工程师还可以向团队成员、管理层,特别是产品经理强调软件工程师的
贡献。让产品经理参与到结果中来,并将下游数据处理作为产品的一部分,鼓励他们将
稀缺的软件工程师分配到与数据工程师的合作中来。理想情况下,软件工程师可以部分 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

设计数据密集型应用程序

设计数据密集型应用程序

Martin Kleppmann
Understanding DeFi

Understanding DeFi

Alexandra Damsker
INSPIRED

INSPIRED

Marty Cagan

Publisher Resources

ISBN: 9787111745273