第4章 基本的数学知识

下面,我们将学习数据科学实践中常用的数学原理。我知道很多人听到“数学”会感到害怕,所以尽量让这个过程充满乐趣。本章,我们将讨论以下主题:

  • 基本的数学符号和术语。
  • 对数(logarithms)和指数(exponents)。
  • 集合论(set theory)。
  • 微积分(calculus)。
  • 矩阵/线性代数(matrix/linear algebra)。

本章还会介绍数学的其他领域。而且,你还将看到这些数学理论如何在科学实验和数据科学中发挥作用,比如统计模型和概率模型中用到的数学理论。

在第1章,我们曾把数学作为数据科学的三要素之一。本章介绍的所有数学理论,都是你在成为数据科学家道路上必须掌握的基本的数学知识。

数学作为一门科学,是人类发明的一门非常古老的逻辑思维学科。早在公元前3 000年的美索不达米亚平原,人类就已经开始用算术(arithmetic)和其他更高层次的数学知识探寻哲学问题。

今天,我们生活的方方面面都依赖于数学。这听起来有点陈词滥调,但我确实是认真的。当你在浇花或者喂狗粮时,你潜意识中的数学机器一直在运转。它计算着每天要给花浇多少水,预测着小狗下一次饥饿的时间,以便你能及时喂食。无论人们是否有意识地使用了数学原理,这些概念都已经深入到每个人的大脑中。作为数学老师,我的职责是让你们意识到这一点。

首先,我们将介绍最基本的数学符号,以及数据科学家会用到的更深奥的符号。

向量(vector)指既有大小又有方向的对象。这个定义在实际使用中有点复杂。对我们而言,向量是用来表示一系列数字的一维数组。换句话说,向量是一个由数字构成的列表。

向量通常用箭头或者粗体字表示,如下所示:

Get 数据科学原理 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.