第 4 章. 使用 AutoML 预测广告媒体渠道销售额
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
在本章中,您将建立一个 AutoML 模型来预测广告媒体渠道的销售额。首先,您将使用 Pandas 探索数据。然后,学习如何使用 AutoML 构建、训练和部署一个 ML 模型来预测销售额。您将通过性能指标全面了解模型的性能,并回答常见的业务问题。在此过程中,您还将学习回归分析,这是预测用例中常用的一种技术。
业务应用案例:媒体渠道销售预测
企业使用广告媒体渠道推广其产品、服务或品牌。营销人员和媒体策划人员创建的营销活动可能会在数字媒体、电视、广播或报纸上播出。在这种情况下,你在一家中型太阳能公司的营销部门担任媒体策划。贵公司的媒体预算不多,需要评估哪些渠道能以最少的成本带来最大的效益。这是一个支出优化问题。
公司要求你制定一项营销计划,以提高明年的产品销量。为了实现这一目标,您需要了解媒体渠道产品广告预算对总体销售额的影响。广告数据集记录了数字、电视、广播和报纸媒体渠道广告成本产生的销售收入。
通常情况下,这种来自团队领导的请求会交给数据科学家或数据分析师。但是,尽管您没有任何编码经验,营销团队领导还是要求您使用 AutoML 建立一个销售预测模型,这是他们想在团队中首次尝试的。我们的目标是建立一个 ML 模型,根据在每个媒体渠道上花费的资金来预测会产生多少销售量。
业务问题包括
-
该模型能否预测在每个媒体渠道花费的资金将产生多少销售额?
-
广告预算与销售额之间有关系吗?
-
哪种媒体渠道对销售额贡献最大?
-
该模型是否可用于根据媒体渠道的拟议预算预测未来的销售额?
-
模型预测未来销售额的准确度如何?
用例是一个简单的回归问题,只有五个变量,您可以用它们来回答前面的五个问题。
项目数据集
数据集由历史营销渠道数据组成,可用于洞察支出分配和预测销售。本章使用的数据集(advertising_2023 数据集)基于 Daniela Witten、Gareth M. James、Trevor Hastie 和 Robert Tibshirani 合著的《统计学习导论与 R 应用》(An Introduction to Statistical Learning with Applications in R)(施普林格,2021 年)中的数据。广告数据集记录了电视、广播和报纸媒体特定产品广告预算(单位:千美元)的广告销售收入(单位:千个)。
本书对数据集进行了更新,加入了数字变量,并进行了修改,以显示数字预算对销售额的影响。市场数量从 ...