第4章 建模分析股票市场数据(R)
本章中将涉及以下几点。
- 获取股票市场数据
- 描述数据
- 清洗和研究数据
- 形成相对估值法
- 分析历史价格筛选股票
简介
本章将引导你参与一个财务分析项目,通过分析股票市场数据,判断股市是被高估还是被低估,从而识别出有效投资的目标股票列表,并对目标股票的历史价格进行可视化分析。
我们必须指出,本章的目标不是让你成为股市分析方面的专家,或者帮你致富。华尔街量化投资分析师研究的模型,明显比我们在这里接触到的更为复杂。很多书整本都在讲解股市模型和金融工程,而我们只有一个章节来阐述这个问题。因此,受时间和格式所限,本章主要目标如下。
- 对我们将要分析的数据有一个基本了解
- 找到有效地对这些数据进行分析和建模的方法
- 如何利用数据科学工具和方法对这些数据进行分析
本章用到的当前数据来源于finviz.com网站,而股票历史价格数据则通过Yahoo财经日报获得。
和前几章类似,本项目也采用R统计语言作为最重要的分析工具。可能你已经注意到,R有很多功能强大的程序包帮助我们完成分析任务;本章将用到其中的部分程序包。此外,本章中依然遵循数据科学项目实现流程,但会因为处理不同的数据类型和任务类型而适当修改流程。
准备工作
为了完成本章的数据科学项目,你需要一个可以访问互联网的计算机,并且这台计算机上已经安装了R语言和以下包。
install.packages("XML") install.packages("ggplot2") install.packages("plyr") install.packages("reshape2") install.packages("zoo") library(XML) library(ggplot2) library(plyr) library(reshape2) ...
Get 数据科学实战手册 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.