
16
|
第
1
章
构建数据管道来操作数据的摄取。然后,你转换为数据科学家角色并构建
ML
模型。
最后,戴上
ML
工程师的帽子并运用模型产出产品。在大型组织中,机器学习项目
可能经历相同的阶段,但每个阶段可能涉及不同的团队。
研究科学家、数据分析师和开发人员也可能构建和使用人工智能模型,但这些工作
角色并不是本书的重点读者。
研究科学家(
research scientist
)主要致力于发现和开发新算法以推进
ML
学科的发展。
这可能包括机器学习中的各个子领域,例如模型架构、自然语言处理、计算机视觉、
超参数调整、模型可解释性等。与这里讨论的其他角色不同,研究科学家将大部分
时间都花在原型设计和评估新
ML
方法上,而不是构建
ML
生产系统。
数据分析师(
data analyst
)从数据中评估并收集见解,然后为组织中的其他团队总结
这些见解。他们倾向于使用
SQL
和电子表格,并使用商业化智能工具来创建可视化
数据并共享其发现。数据分析师与产品团队紧密合作,以了解他们的见解如何帮助解
决业务问题和创造价值。数据分析师专注于识别现有数据的趋势并从中获得见解,而
数据科学家则更关注于使用这些数据来生成未来的预测以及自动化地或扩展地生成见
解。随着机器学习的日益民主化,数据分析师可以提升自己的技能,成为数据科学家。
开发人员(
developer
)负责构建能够让终端用户访问
ML
模型的生产系统。他们经
常参与设计
API
,这些
API
通过
Web
或移动应用程序以用户友好的格式查询模型并
返回预测。这可能涉及云中托管的模型或者设备上服务的模型。开发人员利用 ...