Skip to Content
学习 AutoML (Chinese Edition)
book

学习 AutoML (Chinese Edition)

by Kerem Tomak
April 2026
Intermediate
586 pages
7h 41m
Chinese
O'Reilly Media, Inc.
Content preview from 学习 AutoML (Chinese Edition)

后记:悄然进行的AutoML革命

若您能读到这里,您已取得了一项重大成就。 你已掌握了驱动现代自动化机器学习的核心技术:超参数优化、神经网络架构搜索以及自动化特征工程。你构建了适用于表格数据、文本、图像和时间序列的处理管道。你使用 MLflow、Kubeflow 和 Airflow 将模型部署到了生产环境中。你见证了 AutoML 在各行各业中的应用——从欺诈检测到需求预测,再到再入院率预测。

如今你掌握的这些技能,若在十年前,需要经过数年的专业培训才能获得。

而我要告诉您的是,您刚刚学到的 AutoML 正在蜕变为一种截然不同的形态。

别慌。这绝非虚假宣传。本书中的所有内容依然极具价值——事实上,其价值甚至比五年前更为珍贵。但这些技能所处的应用环境正在急速变化,若不为即将到来的变革做好准备就让你踏入这个世界,那我便辜负了你的信任。

AutoML的未来不在于更优的超参数调优,而在于能够推断模型为何失败、需要哪些数据以及如何自我修复的系统。我们正从自动化迈向自主化。而理解本书所传授的知识,正是构建——并管理——未来技术的先决条件。

初衷已实现

让我们花点时间来欣赏一下 AutoML 实际上取得了哪些成就。

在AutoGluon、Auto-sklearn和H2O等工具出现之前,构建一个具备生产级质量的机器学习模型是一个艰辛且容易出错的过程。数据科学家们要花数周时间进行特征工程,不断尝试各种转换组合,直到找到可行的方案。模型选择需要运行数十次实验,往往更多地依赖直觉而非系统性的探索。超参数调优意味着要进行整夜(甚至更久)的网格搜索,却无法保证能找到比默认设置更好的方案。

“最后一公里”问题确实存在:企业拥有数据,面临值得解决的业务难题,且高管层愿意为AI项目提供资金。但他们缺乏的是足够多能够可靠驾驭这些“黑魔法”的人才。

AutoML改变了这一现状。你在第二部分学到的技术——贝叶斯优化、多保真度方法、早停策略——自动化了那些耗费数据科学家大量时间的繁琐重复工作。 你在第三部分练习的工具——TabularPredictor、MultiModaltPredictor、TimeSeriesPredictor——在不牺牲质量的前提下抽象化了复杂性。而你在第四部分掌握的集成模式,则展示了如何将这些能力嵌入实际的生产系统中。

数据科学民主化已然实现。如今,一位具备领域专业知识的合格分析师,能够构建出十年前需要专业博士才能完成的模型。AutoML 并未取代数据科学家——它提升了数据科学家的地位,使他们得以专注于问题定义、利益相关者沟通,以及机器无法解答的真正难题。

这就是当初的承诺。而这一承诺已然兑现。

我们赖以构建的假设

但每项成功的技术都蕴含着对世界的某种假设。当这些假设成立时,技术便能完美运行;当它们不成立时,裂痕便会显现。

传统AutoML——也就是你通过本书所掌握的AutoML——建立在若干看似显而易见、以至于鲜少被明言的假设之上:

  • 假设1:模型空间是有限且可枚举的。我们曾假设所有可能的模型可被描述为一个搜索空间:算法(随机森林、梯度提升、神经网络)、超参数(学习率、正则化系数、树深度)以及预处理步骤(归一化、缺失值填充、编码)。这个空间虽大——有时大得惊人——但终究是有界限的。原则上,你可以将所有选项逐一列出。

  • 假设 2:目标函数明确。我们假设成功可通过某种指标来衡量:准确率、F1 分数、均方根误差(RMSE)、受试者工作特征曲线下面积(AUC)。优化该指标即是目标。其他一切——可解释性、公平性、计算成本——均被视为约束条件或次要考量。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

向量数据库 (Chinese Edition)

向量数据库 (Chinese Edition)

Nitin Borwankar

Publisher Resources

ISBN: 0642572369361