第4章 基本的数学知识
下面,我们将学习数据科学实践中常用的数学原理。我知道很多人听到“数学”会感到害怕,所以尽量让这个过程充满乐趣。本章,我们将讨论以下主题:
- 基本的数学符号和术语。
- 对数(logarithms)和指数(exponents)。
- 集合论(set theory)。
- 微积分(calculus)。
- 矩阵/线性代数(matrix/linear algebra)。
本章还会介绍数学的其他领域。而且,你还将看到这些数学理论如何在科学实验和数据科学中发挥作用,比如统计模型和概率模型中用到的数学理论。
在第1章,我们曾把数学作为数据科学的三要素之一。本章介绍的所有数学理论,都是你在成为数据科学家道路上必须掌握的基本的数学知识。
4.1 数学学科
数学作为一门科学,是人类发明的一门非常古老的逻辑思维学科。早在公元前3 000年的美索不达米亚平原,人类就已经开始用算术(arithmetic)和其他更高层次的数学知识探寻哲学问题。
今天,我们生活的方方面面都依赖于数学。这听起来有点陈词滥调,但我确实是认真的。当你在浇花或者喂狗粮时,你潜意识中的数学机器一直在运转。它计算着每天要给花浇多少水,预测着小狗下一次饥饿的时间,以便你能及时喂食。无论人们是否有意识地使用了数学原理,这些概念都已经深入到每个人的大脑中。作为数学老师,我的职责是让你们意识到这一点。
4.2 基本的数学符号和术语
首先,我们将介绍最基本的数学符号,以及数据科学家会用到的更深奥的符号。
4.2.1 向量和矩阵
向量(vector)指既有大小又有方向的对象。这个定义在实际使用中有点复杂。对我们而言,向量是用来表示一系列数字的一维数组。换句话说,向量是一个由数字构成的列表。
向量通常用箭头或者粗体字表示,如下所示:
Get 数据科学原理 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.