第3章 通过基础机器学习预测市场

在第2章中,我们学习了如何设计交易策略、创建交易信号以及实施高级概念,例如交易工具的季节性。更仔细地理解这些概念涉及广阔的领域,包括随机过程、随机漫步、鞅和时间序列分析,你可以按照自己的节奏去探索。

那么接下来讲什么呢?让我们了解一种更先进的预测和预报方法:统计推理和预测。这就是所谓的机器学习,其基本原理是在19世纪和20世纪初发展起来的,并且一直在发展。近来,由于可以获得极具成本效益的处理能力和易于获得的大型数据集,人们对机器学习算法及其应用的兴趣再度上升。机器学习是一个庞大的领域,处于线性代数、多元微积分、概率论、频率论和贝叶斯统计学的交叉点,而深入分析机器学习也超出了本书的范围。然而,机器学习方法在Python中非常容易理解并且相当直观,所以我们将解释这些方法背后的直觉,并看看它们如何在算法交易中应用。首先,让我们介绍一些基本概念和符号。

本章将介绍以下主题。

 了解术语和符号。

 使用线性回归方法创建预测模型。

 使用线性分类方法创建预测模型。

为了快速拓宽思路并建立关于供求关系的“直觉”,我们有一个简单且完全假设的数据集,其中包括从调查中获得的几个随机样本的身高(Height)、体重(Weight)和种族(Race)。让我们来看看这个数据集,如表3-1所示(1inch=25.4mm,1lb≈0.454kg)。

表3-1

Height /inch

Weight /lb

Race

72

180

Asian

66

150

Asian

70

190

African

75

210

Caucasian

64

150

Get Python算法交易实战 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.