序言
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
人工智能(AI)可以定义为计算机显示智能的广泛研究领域。显示智能 "这一短语含糊不清;它可以被解释为计算机做出了我们期望生物做出的决定。人工智能的概念自古就有,至少在神话中是这样。希腊神话中的塔洛斯就是一个著名的例子,塔洛斯是一个青铜自动机,用来保护欧罗巴免受想要绑架她的入侵者的伤害。几个世纪过去了,人工智能的基本形式从神话领域进入了现实生活。
在现代,人工智能在增强人的能力、自动决策和其他对人来说耗时的过程中找到了自己的用武之地。最早开发于 20 世纪 70 年代的专家系统就是现代人工智能的一个例子。专家系统利用知识库、事实和规则集合以及推理系统来合成新知识。专家系统的主要缺点是需要领域专家花费时间和精力为知识库创建事实和规则。
近几十年来,人工智能的另一种形式变得越来越普遍。机器学习(ML)是一门让计算机从提供的数据中学习算法,而不是让程序员提供算法的学科。与专家系统相比,另一种表述方式是,ML 是利用数据发现规则,而不是让专家为你编写规则。
如今,ML 几乎涉及到每一个行业。在零售业,ML 被用于需求预测,提前几个月预测产品或服务的预期销量。旅游业根据客户过去的旅行记录和其他信息,利用人工智能向客户推荐兴趣点和目的地。在医疗保健领域,ML 不仅可以用来判断 X 光图像中是否包含健康或患病的肺部,还可以精确定位导致判断结果的 X 光图像区域,供医学专家进行更详细的探索。多边层析法的广泛应用可以写满一整本书。在本书中,我们将重点介绍一些具体的 ML 用例,包括广告媒体渠道销售、能源生产和客户流失等。
人工智能在工业中的应用如此之多,探索不同的可能性令人兴奋。很多人都认为,ML 只是专家的研究领域。也就是说,除非你在许多不同领域(计算机科学、数学、统计学等)拥有大量背景知识,否则你就没有希望在实践中使用 ML。事实并非如此。
近年来,公民数据科学家的概念变得越来越普遍。公民数据科学家是指那些不一定在数据科学或相关领域接受过正规教育和/或扮演过正规角色,但可以在从事某些数据科学工作的同时,还能发挥其他特定领域专业知识的人。目前已经开发出许多易于使用的 ML 工具,可供这部分人使用,本书的目的就是帮助和鼓励更多的人成为公民数据科学家。
谁应该阅读这本书?
本书的目标是教读者如何为结构化(表格)数据构建 ML 问题框架,为 ML 工作流准备数据,以及使用不同的无代码、低代码和一些基本的自定义代码解决方案构建和使用 ML 模型。您将在具体业务问题的框架内,通过逐步的过程来理解这些目标。本书的主要受众是业务分析师、数据分析师、学生和有抱负的公民数据科学家,他们寻求学习如何使用自动机器学习(AutoML)、BigQuery ML(使用 SQL)和 Python 中的自定义训练,非常快速地将 ML 应用到他们的工作中。本书假定读者对数据分析有一定的基本熟悉程度,但不需要成为专家也能通过阅读本书获益。
任何考虑进入数据科学和/或 ML 工程领域的人都会发现,本书是实现目标的第一步。ML 从业人员可能会发现本书过于基础,无法满足他们的需求,但如果他们不熟悉所使用的某些工具,他们可能会发现有关这些工具的讨论很有帮助。
本书不要求读者事先掌握 ML 或特定编程语言的知识,但如果读者对编程概念、Python 和 SQL 有一定的基础知识,就会发现本书更容易阅读。我们在全书的上下文中引用了其他基础材料。除了 ML 概念和基于用例的示例外,您还将探索不同的工具,如 ...