第 14 章 MLOps 和机器学习工程
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
机器学习工程师是 2020 年最热门的职称之一。其他热门职称包括数据工程师、数据科学家和机器学习科学家。 虽然你可以成为 DevOps 专家,但 DevOps 是一种行为,DevOps 的原则可以应用于任何软件项目,包括机器学习。让我们来看看 DevOps 的一些核心最佳实践:持续集成(Continuous Integration)、持续交付(Continuous Delivery)、微服务(Microservices)、基础设施即代码(Infrastructure as Code)、监控与日志记录(Monitoring and Logging)以及沟通与协作(Communication and Collaboration)。其中哪些不适用于机器学习?
软件工程项目越复杂,机器学习就越复杂,就越需要 DevOps 原则。 还有比进行机器学习预测的 API 更合适的微服务实例吗? 在本章中,让我们深入探讨如何利用 DevOps 思维以专业、可重复的方式进行机器学习。
什么是机器学习?
机器学习是一种使用算法自动学习数据的方法。 主要有四种类型:监督式、半监督式、无监督式和强化式。
监督机器学习
在有监督的机器学习中,正确答案是已知的,并且已经标记。 例如,如果您想根据体重预测身高,您可以收集人们身高和体重的示例。 身高是目标,体重是特征。
让我们来看看有监督机器学习的例子:
-
25 000 份 18 岁儿童身高和体重的合成记录
摄取
In[0]:
importpandasaspd
In[7]:
df=pd.read_csv("https://raw.githubusercontent.com/noahgift/\regression-concepts/master/\height-weight-25k.csv")df.head()
Out[7]:
| 索引 | 高度-英寸 | 重量-磅 | |
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
EDA
让我们看看这些数据,看看可以探索出什么。
散点图
在本例中,使用了 Python 中流行的绘图库 seaborn 来实现数据集的可视化。 如果需要安装,可以通过!pip install seaborn 在笔记本中安装。 您也可以通过!pip install <name of package> 安装该部分中的任何其他库。如果您使用的是 Colab 笔记本,我们会为您安装这些库。请参见高度/重量 lm 图(图 14-1)。
In[0]:
importseabornassnsimportnumpyasnp
In[9]:
sns.lmplot("Height-Inches","Weight-Pounds",data=df)
图 14-1. 高度/重量 lm 图
描述性统计
接下来,可以生成一些描述性统计数据。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access