第1章 预测分析过程

本章主要内容

预测分析的内容。

预测分析的重要概念。

预测分析的过程。

Python数据科学栈的简单介绍。

这是本书介绍概念较多的部分。你或许希望直奔“编程建模”的主题,但要学习本书的内容,还是应该先理解预测分析的基本概念。在本章中,我们将介绍什么是预测分析,接着对这个热点领域中一些最重要的概念加以定义,然后介绍预测分析过程的各个阶段,并进行简单的讨论。在后续章节中,我们会围绕每个阶段的主题展开详细阐述。

虽然本章大体上是属于概念性的,但是要读懂代码,请务必安装好下列软件。

Python 3.6或更高版本。

Jupyter Notebook。

最新版本的Python库:NumPy和Matplotlib。

本书强烈推荐你安装Anaconda。Anaconda是一个开源的Python发行版本,其中包含大量的软件包。安装好Anaconda就意味着成功安装了本书将要用到的大多数软件。如果你还不熟悉Anaconda,请参考1.5.1节的内容。

近年来,全世界可观测数据的数量呈现指数型增长态势,而相关科技术语的数量更是呈现突飞猛进的增长。业界、媒体和学术界的话题逐渐转向了(有时风头会过热)大数据、数据挖掘、分析、机器学习、数据科学、数据工程、统计学习和人工智能等。当然,本书的主题预测分析也是其中之一。

目前,这些术语还都比较新,因此术语本身及其确切含义多存在不少易混淆之处,不同的术语之间也会有重复。为便于理解,我们并没有定义所有术语,而是针对主要术语给出了实用性定义。这些定义足以刻画预测分析的内涵:

预测分析是一个应用领域,它基于数据应用各种量化方法进行预测。

下面让我们分析一下上述定义。

应用领域 ...

Get Python预测分析实战 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.