Book description
本书的第2版涵盖了277个R语言实用方法,可以帮助你快速而有效地使用R进行数据分析。R语言给我们提供了统计分析的一切工具,但是R本身的结构可能不容易掌握。本书提供的面向任务的R语言实用方法涉及从基本的分析任务到输入和输出、常用统计分析、绘图、线性回归等内容,它们可以让你马上应用R高效地工作。
每一个R语言方法都专注于一个特定的问题,随后的讨论则对问题的解决方案给出解释,并阐释该方法的工作机理。对于R的初级用户,本书将帮助你步入R的殿堂;对于R的中级用户,本书将加深你对R的理解并拓展你的视野。通过本书,可以使你的分析工作顺利完成并学习更多R语言知识。
本书主要内容:
- 建立向量、处理变量,以及执行其他基本函数。
- 简化数据的输入和输出。
- 处理矩阵、列表、因子和数据框等数据结构。
- 分析概率、概率分布和随机变量。
- 计算统计量和置信区间,进行统计检验。
- 创建各种图形。
- 构建线性回归和方差分析(ANOVA)等统计模型。
- 探索高级统计技术,如聚类分析等。
Table of contents
- 封面
- 扉页
- 版权页
- O'Reilly介绍
- 译者序
- 目录 (1/2)
- 目录 (2/2)
- 前言
- 第1章 R入门和获得帮助
- 第2章 基础知识
- 第3章 R软件导览
- 第4章 输入与输出
- 第5章 数据结构 (1/2)
-
第5章 数据结构 (2/2)
- 5.1 对向量添加数据
- 5.2 在向量中插入数据
- 5.3 理解循环规则
- 5.4 构建因子
- 5.5 将多个向量合并成单个向量以及一个并行因子
- 5.6 创建列表
- 5.7 根据位置选定列表元素
- 5.8 根据名称选定列表元素
- 5.9 构建一个名称/值关联表
- 5.10 从列表中移除元素
- 5.11 将列表转换为向量
- 5.12 从列表中移除取值为空值的元素
- 5.13 使用条件来移除列表元素
- 5.14 矩阵初始化
- 5.15 执行矩阵运算
- 5.16 将描述性名称赋给矩阵的行和列
- 5.17 从矩阵中选定一行或一列
- 5.18 用列数据初始化数据框
- 5.19 用行数据初始化数据框
- 5.20 对数据框添加行
- 5.21 根据位置选择数据框的列
- 5.22 根据列名选择数据框的列
- 5.23 修改数据框的列名
- 5.24 从数据框中移除NA值
- 5.25 根据名称排除列
- 5.26 合并两个数据框
- 5.27 根据共有列合并数据框
- 5.28 基本数据类型之间的转换
- 5.29 从一种结构化数据类型转换到另一种数据类型
- 第6章 数据转换
- 第7章 字符串和日期
- 第8章 概率
- 第9章 统计概论
-
第10章 图形
- 10.1 创建散点图
- 10.2 添加标题和标签
- 10.3 添加(或去除)网格
- 10.4 给ggplot图形添加主题
- 10.5 创建多组散点图
- 10.6 添加(或去除)图例
- 10.7 绘制散点图的回归线
- 10.8 多变量散点图的绘制
- 10.9 创建多个分组的散点图
- 10.10 创建条形图
- 10.11 对条形图添加置信区间
- 10.12 给条形图上色
- 10.13 绘制从点x到点y的线
- 10.14 改变线的类型、宽度或者颜色
- 10.15 绘制多个数据集
- 10.16 添加垂直线和水平线
- 10.17 创建箱线图
- 10.18 对每个因子水平创建箱线图
- 10.19 创建直方图
- 10.20 对直方图添加密度估计
- 10.21 创建正态Q-Q图
- 10.22 创建其他Q-Q图
- 10.23 用多种颜色绘制变量
- 10.24 绘制函数
- 10.25 在一页中显示多个图形
- 10.26 在文档中绘制图形
-
第11章 线性回归和方差分析
- 11.1 简单线性回归
- 11.2 多元线性回归
- 11.3 得到回归统计量
- 11.4 理解回归的汇总结果
- 11.5 运行无截距项的线性回归
- 11.6 只应用与因变量高度相关的变量进行回归
- 11.7 运行有交互项的线性回归
- 11.8 选择最合适的回归变量
- 11.9 对数据子集进行回归
- 11.10 在回归公式中使用表达式
- 11.11 多项式回归
- 11.12 对变换后的数据进行回归
- 11.13 寻找最佳幂变换(Box-Cox过程)
- 11.14 回归系数的置信区间
- 11.15 绘制回归残差
- 11.16 线性回归的诊断
- 11.17 识别有影响的观察值
- 11.18 残差自相关检验(Durbin-Watson检验)
- 11.19 预测新值
- 11.20 建立预测区间
- 11.21 执行单因素方差分析
- 11.22 创建交互关系图
- 11.23 找到组间均值的差异
- 11.24 执行稳健方差分析(Kruskal-Wallis检验)
- 11.25 运用方差分析比较模型
-
第12章 有用的方法
- 12.1 查看你的数据
- 12.2 输出赋值结果
- 12.3 对行和列求和
- 12.4 按列输出数据
- 12.5 对数据分组
- 12.6 找到特定值的位置
- 12.7 每隔n个选定一个向量元素
- 12.8 找到最小值或最大值
- 12.9 生成多个变量的组合
- 12.10 转换一个数据框
- 12.11 对数据框排序
- 12.12 移除变量属性
- 12.13 显示对象的结构
- 12.14 代码运行时间
- 12.15 避免显示警告和错误消息
- 12.16 从列表中提取函数参数
- 12.17 定义你自己的二元运算符
- 12.18 不显示R启动消息
- 12.19 获取和设置环境变量
- 12.20 使用代码段
- 12.21 本地并行运行R代码
- 12.22 远程并行运行R代码
- 第13章 高级数值分析和统计方法
-
第14章 时间序列分析
- 14.1 表示时间序列
- 14.2 绘制时序图
- 14.3 提取最早或者最新的观测值
- 14.4 选取时间序列的子集
- 14.5 合并多个时间序列
- 14.6 缺失时间序列的填充
- 14.7 时间序列的滞后
- 14.8 计算逐次差分
- 14.9 时间序列的相关计算
- 14.10 计算移动平均
- 14.11 在日历时间范围内应用函数
- 14.12 应用滚动函数
- 14.13 绘制自相关函数图
- 14.14 检验时间序列的自相关
- 14.15 绘制偏自相关函数
- 14.16 两个时间序列间的滞后相关性
- 14.17 剔除时间序列的趋势
- 14.18 拟合ARIMA模型
- 14.19 剔除ARIMA模型中不显著的系数
- 14.20 对ARIMA模型进行诊断
- 14.21 用ARIMA模型进行预测
- 14.22 绘制预测结果
- 14.23 均值回归的检验
- 14.24 时间序列的平滑
- 第15章 简单编程
- 第16章 R Markdown和发表
- 作者简介
- 封面介绍
Product information
- Title: R 语言经典实例(原书第 2 版)
- Author(s):
- Release date: June 2020
- Publisher(s): China Machine Press
- ISBN: 9787111656814
You might also like
book
复杂性思考:复杂性科学和计算模型(原书第2 版)
复杂性科学使用计算来探索物理和社会科学。在本书中,你将使用图表、元胞自动机以及基于智能体的模型来研究物理学、生物学和经济学。 无论你是中等水平的Python程序员还是希望学习计算机建模的学生,都可以通过一系列工作示例、练习、案例研究和易于理解的解释深入学习复杂系统。 在更新后的第2版中,你将: 使用NumPy数组和SciPy方法,包括基本信号处理和快速傅里叶变换。 研究复杂物理系统的抽象模型,包括幂律、分形、粉红噪声和图灵机。 获取包含入门代码和解决方案的Jupyter笔记本,以便重复实现和扩展原始实验的复杂性以及计算模型,如Turmite、图灵机和元胞自动机。 探索科学中的哲学,包括科学规律的本质、理论选择,以及现实主义和工具主义。 作为Python编程与算法的理想教材,本书还有助于自学者掌握关于他们可能未曾谋面的主题与想法的宝贵经验。
book
数据库可靠性工程:数据库系统设计与运维指南
信息技术领域的基础设施即代码革命正在影响着数据库管理。本书从实践角度介绍如何将网站可靠性工程的实践应用于数据库架构和运维,为想成为数据库可靠性工程师的专业人士提供一个指导框架,开发人员、系统管理员和初中级数据库管理员等都能从中受益。 本书首先介绍数据库可靠性工程师需要掌握的核心运维概念,然后介绍各种数据库持久性选项,包括如何利用关键技术提供有弹性、可扩展、高性能的数据存储和检索。有了数据库可靠性工程的坚实基础,读者便能深入研究任何现代数据库的架构和运维。 服务等级要求和风险管理 构建并演进具有运维可见性的架构 基础设施工程和基础设施管理 如何推动发布管理流程 数据存储、索引和复制 明确数据存储的特性和用例 数据存储架构组件和数据驱动的架构
book
大规模数据分析和建模:基于 Spark 与 R
如果你和大多数R语言用户一样,那你肯定喜欢统计学,也能够深入理解统计学。但是随着组织内部不断收集大量数据,添加Apache Spark这类工具就变得理所当然。在本书中,数据科学家和使用大规模数据应用的专业人员会学到如何使用Spark和R解决大数据和大计算问题。 作者会展示如何将Spark和R结合起来进行大数据分析。本书涵盖相关的数据科学话题、聚类计算,以及高级用户会感兴趣的问题。 在Apache Spark环境下,使用R来分析、探索、转换、可视化数据。 构建统计模型来提取信息并预测输出,自动化生产级的工作流程。 使用分布式计算技术在多台机器上进行分析和建模。 轻松使用Spark处理多个数据源和格式的大规模数据。 学习其他用于大规模图处理、地理空间分析和基因组学分析的建模框架。 深入高级话题,包括定制转换、实时数据处理和创建定制化Spark扩展。
book
数据库系统内幕
当我们选择、使用并维护一个数据库系统时,理解它的原理至关重要。但是现今有太多的分布式数据库和工具可供使用,要想弄明白每一种工具的作用以及它们之间的区别往往并不容易。在这本实用指南中,作者讲解了现代数据库和存储引擎背后的概念。 通过本书,你将领略到从众多书籍、论文、博客和多个开源数据库源代码中精心选取的相关材料,并且了解到众多现代数据库之间最重要的区别在于决定存储结构和数据分布的子系统。 你将深入了解如下内容: 存储引擎:学习存储的种类、分类依据,理解基于B树和不可变日志存储结构的存储引擎。 存储构建块:理解数据库文件如何使用诸如页缓存、缓冲池等辅助数据结构来组织构建高效的存储。 分布式系统:逐步学习节点和进程间如何连接并构建复杂的通信模式。 数据库集群:深入探究现在数据库中常用的一致性模型,并了解分布式存储系统是如何实现一致性的。