第 8 章. 使用 Copilot进行基础 统计
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
我一直对烹饪充满热情。无论是甜点还是咸味菜肴,我都喜欢在厨房里尝试新花样。但正如每位厨师所知,光有食材是不够的。你需要恰当的比例、精准的时机以及恰当的方法,才能将它们融合成一道值得端上桌的佳肴。
统计学的工作原理与之如出一辙。数据本身,不过是一堆原始原料。若没有统计方法的框架——那些告诉你如何测量、混合和解读的“食谱”——你就无法将这些原料转化为有用的东西。
在本章中,我们将探讨如何将基本的统计思维与 Copilot 的功能相结合,从而帮助您将一堆杂乱的原始数字转化为清晰且可付诸行动的洞察。我们将重点介绍描述性统计,但您也可以轻松地将本章所述的概念应用到其他类型的统计中。
本章内容包括:
-
基础统计学导论
-
集中趋势的度量
-
离散度指标
-
数据分布与形状
-
如何解读统计结果
让我们先从介绍基础统计学开始。
基础统计学导论
基础统计通常分为三个核心类别:
- 集中趋势度量
-
这些指标通过一个代表性数值来概括数据集的中心位置。
- 离散度指标
-
这些指标量化了数据围绕该中心值的变异或分散程度。
- 数据分布与形状
-
这些指标描述了数据集的整体结构或特征。
在本章中,您将详细探讨这三个类别。目前,只需了解它们的作用以及它们在描述数据集时如何相互补充即可。
若要在 Excel 中使用 Copilot 计算这些指标中的任何一项,遵循基于两个要素的简单 prompt 模式会很有帮助:
-
上下文标识了您正在处理的数据列。
-
要点指定了要计算的统计度量。
如前所述,请根据您的目标选择相应的 Copilot 模式:若需修改工作表,请使用“代理模式”;若进行不改变数据的计算,请使用“分析模式”;若需获取一般性指导,请使用“聊天”模式。关键不在于功能名称(名称可能会变),而在于您使用该功能背后的意图。
例如,您可以编写以下prompt:
Consider column X. Calculate measure Y using an Excel formula.
通常,Copilot 会建议将结果插入 X 列下方作为输出。在下一节中,您将看到如何在实践中应用这种结构,首先从集中趋势的度量开始。
集中趋势度量
集中趋势度量通过 单一数值描述数据集的中心位置。最常用的指标是平均值、中位数和众数。 每种指标各有优势,最适合特定的数据场景。 表 8-1描述了每种度量,指明了何时使用,并提供了用于计算的 Excel 公式。
| 名称 | 描述 | 何时使用 | Excel 公式 |
|---|---|---|---|
|
均值(平均值) |
数据集中所有值的总和除以值的个数 |
数据呈对称分布,且无异常值 |
=AVERAGE(A2:A100) |
|
中位数 |
有序数据集中的中间值 |
数据呈偏态分布或存在离群值时,因其不受极端值影响 |
=MEDIAN(A2:A100) |
|
众数 |
数据集中出现频率最高的数值 |
用于识别数值数据集中的重复值 |
=MODE.SNGL(A2:A100) |
提示
如果数据为多峰分布,MODE.SNGL将仅返回数据集中遇到的第一个峰值。 若需返回所有峰值,请改用MODE.MULT。
要了解如何使用 Copilot 计算集中趋势 指标,请参考由 Justin Matejka 和 George Fitzmaurice 创建的Datasaurus ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access