R 语言经典实例(原书第 2 版)

Book description

本书的第2版涵盖了277个R语言实用方法,可以帮助你快速而有效地使用R进行数据分析。R语言给我们提供了统计分析的一切工具,但是R本身的结构可能不容易掌握。本书提供的面向任务的R语言实用方法涉及从基本的分析任务到输入和输出、常用统计分析、绘图、线性回归等内容,它们可以让你马上应用R高效地工作。

每一个R语言方法都专注于一个特定的问题,随后的讨论则对问题的解决方案给出解释,并阐释该方法的工作机理。对于R的初级用户,本书将帮助你步入R的殿堂;对于R的中级用户,本书将加深你对R的理解并拓展你的视野。通过本书,可以使你的分析工作顺利完成并学习更多R语言知识。

本书主要内容:

  • 建立向量、处理变量,以及执行其他基本函数。
  • 简化数据的输入和输出。
  • 处理矩阵、列表、因子和数据框等数据结构。
  • 分析概率、概率分布和随机变量。
  • 计算统计量和置信区间,进行统计检验。
  • 创建各种图形。
  • 构建线性回归和方差分析(ANOVA)等统计模型。
  • 探索高级统计技术,如聚类分析等。

Table of contents

  1. 封面
  2. 扉页
  3. 版权页
  4. O'Reilly介绍
  5. 译者序
  6. 目录 (1/2)
  7. 目录 (2/2)
  8. 前言
    1. 方法
      1. 对术语的说明
      2. 软件及平台说明
      3. 其他资源
      4. 本书约定
      5. 示例代码
      6. O’Reilly线上学习
      7. 如何联系我们
      8. 致谢
  9. 第1章 R入门和获得帮助
    1. 1.1 下载和安装R软件
    2. 1.2 安装RStudio
    3. 1.3 开始运行RStudio
    4. 1.4 输入R命令
    5. 1.5 退出RStudio
    6. 1.6 中断R正在运行的程序
    7. 1.7 查看帮助文档
    8. 1.8 获取函数的帮助文档
    9. 1.9 搜索帮助文档
    10. 1.10 查看R添加包帮助信息
    11. 1.11 通过网络获取帮助
    12. 1.12 寻找相关函数与添加包
    13. 1.13 查询邮件列表
    14. 1.14 向Stack Overflow或社区的其他网站提交问题
  10. 第2章 基础知识
    1. 2.1 在屏幕上显示内容
    2. 2.2 设定变量
    3. 2.3 列出所有变量
    4. 2.4 删除变量
    5. 2.5 生成向量
    6. 2.6 计算基本统计量
    7. 2.7 生成数列
    8. 2.8 向量比较
    9. 2.9 选取向量中的元素
    10. 2.10 向量的计算
    11. 2.11 运算符优先级问题
    12. 2.12 减少输入,得到更多命令
    13. 2.13 创建函数调用的管道
    14. 2.14 常见错误
  11. 第3章 R软件导览
    1. 3.1 获取和设定工作目录
    2. 3.2 创建一个新的RStudio项目
    3. 3.3 保存工作空间
    4. 3.4 查看历史命令记录
    5. 3.5 保存先前命令产生的结果
    6. 3.6 通过搜索路径显示已加载的软件包
    7. 3.7 查看已安装的R包列表
    8. 3.8 使用R包中的函数
    9. 3.9 使用R的内置数据集
    10. 3.10 从CRAN网站安装R包
    11. 3.11 从GitHub网站安装R包
    12. 3.12 设定或改变默认CRAN网站镜像
    13. 3.13 运行脚本
    14. 3.14 批量运行R代码
    15. 3.15 找到R的主目录
    16. 3.16 R的自定义
    17. 3.17 在云端使用R和RStudio
  12. 第4章 输入与输出
    1. 4.1 使用键盘输入数据
    2. 4.2 显示更少的位数(或更多的位数)
    3. 4.3 将输出结果重定向到某一文件
    4. 4.4 显示文件列表
    5. 4.5 解决无法在Windows中打开文件的问题
    6. 4.6 阅读固定宽度数据记录
    7. 4.7 读取表格数据文件
    8. 4.8 读取CSV文件
    9. 4.9 写入CSV文件
    10. 4.10 从网络中读取表格或CSV格式数据
    11. 4.11 从Excel文件读取数据
    12. 4.12 将数据写入Excel文件
    13. 4.13 从SAS文件读取数据
    14. 4.14 读取HTML表格数据
    15. 4.15 读取复杂格式数据文件
    16. 4.16 读取MySQL数据库中的数据
    17. 4.17 通过dbplyr访问数据库
    18. 4.18 保存和传送对象
  13. 第5章 数据结构 (1/2)
  14. 第5章 数据结构 (2/2)
    1. 5.1 对向量添加数据
    2. 5.2 在向量中插入数据
    3. 5.3 理解循环规则
    4. 5.4 构建因子
    5. 5.5 将多个向量合并成单个向量以及一个并行因子
    6. 5.6 创建列表
    7. 5.7 根据位置选定列表元素
    8. 5.8 根据名称选定列表元素
    9. 5.9 构建一个名称/值关联表
    10. 5.10 从列表中移除元素
    11. 5.11 将列表转换为向量
    12. 5.12 从列表中移除取值为空值的元素
    13. 5.13 使用条件来移除列表元素
    14. 5.14 矩阵初始化
    15. 5.15 执行矩阵运算
    16. 5.16 将描述性名称赋给矩阵的行和列
    17. 5.17 从矩阵中选定一行或一列
    18. 5.18 用列数据初始化数据框
    19. 5.19 用行数据初始化数据框
    20. 5.20 对数据框添加行
    21. 5.21 根据位置选择数据框的列
    22. 5.22 根据列名选择数据框的列
    23. 5.23 修改数据框的列名
    24. 5.24 从数据框中移除NA值
    25. 5.25 根据名称排除列
    26. 5.26 合并两个数据框
    27. 5.27 根据共有列合并数据框
    28. 5.28 基本数据类型之间的转换
    29. 5.29 从一种结构化数据类型转换到另一种数据类型
  15. 第6章 数据转换
    1. 6.1 将函数应用于列表的每个元素
    2. 6.2 将函数应用于数据框的每一行
    3. 6.3 将函数应用于矩阵的每一行
    4. 6.4 将函数应用于每列
    5. 6.5 将函数应用于平行向量或列表
    6. 6.6 将函数应用于一组数据
    7. 6.7 基于某些条件生成一个新列
  16. 第7章 字符串和日期
    1. 7.1 获取字符串长度
    2. 7.2 连接字符串
    3. 7.3 提取子串
    4. 7.4 根据分隔符分割字符串
    5. 7.5 替代子串
    6. 7.6 生成字符串的所有成对组合
    7. 7.7 得到当前日期
    8. 7.8 转换字符串为日期
    9. 7.9 转换日期为字符串
    10. 7.10 转化年、月、日为日期
    11. 7.11 得到儒略日期
    12. 7.12 提取日期的一部分
    13. 7.13 创建日期序列
  17. 第8章 概率
    1. 得到关于概率分布的帮助
    2. 8.1 计算组合数
    3. 8.2 生成组合
    4. 8.3 生成随机数
    5. 8.4 生成可再生的随机数
    6. 8.5 生成随机样本
    7. 8.6 生成随机序列
    8. 8.7 随机排列向量
    9. 8.8 计算离散分布的概率
    10. 8.9 计算连续分布的概率
    11. 8.10 转换概率为分位数
    12. 8.11 绘制密度函数
  18. 第9章 统计概论
    1. 9.1 数据的汇总
    2. 9.3 因子数据的表格和列联表创建
    3. 9.4 检验分类变量独立性
    4. 9.5 计算数据集的百分位数(和四分位数)
    5. 9.6 求分位数的逆
    6. 9.7 数据转换为z分数
    7. 9.8 检验样本均值(t检验)
    8. 9.9 均值的置信区间
    9. 9.10 中位数的置信区间
    10. 9.11 检验样本比例
    11. 9.12 比例的置信区间
    12. 9.13 检验正态性
    13. 9.14 游程检验
    14. 9.15 比较两个样本的均值
    15. 9.16 比较两个非参数样本的位置
    16. 9.17 检验相关系数的显著性
    17. 9.18 检验组的等比例
    18. 9.19 组均值间成对比较
    19. 9.20 检验两样本的相同分布
  19. 第10章 图形
    1. 10.1 创建散点图
    2. 10.2 添加标题和标签
    3. 10.3 添加(或去除)网格
    4. 10.4 给ggplot图形添加主题
    5. 10.5 创建多组散点图
    6. 10.6 添加(或去除)图例
    7. 10.7 绘制散点图的回归线
    8. 10.8 多变量散点图的绘制
    9. 10.9 创建多个分组的散点图
    10. 10.10 创建条形图
    11. 10.11 对条形图添加置信区间
    12. 10.12 给条形图上色
    13. 10.13 绘制从点x到点y的线
    14. 10.14 改变线的类型、宽度或者颜色
    15. 10.15 绘制多个数据集
    16. 10.16 添加垂直线和水平线
    17. 10.17 创建箱线图
    18. 10.18 对每个因子水平创建箱线图
    19. 10.19 创建直方图
    20. 10.20 对直方图添加密度估计
    21. 10.21 创建正态Q-Q图
    22. 10.22 创建其他Q-Q图
    23. 10.23 用多种颜色绘制变量
    24. 10.24 绘制函数
    25. 10.25 在一页中显示多个图形
    26. 10.26 在文档中绘制图形
  20. 第11章 线性回归和方差分析
    1. 11.1 简单线性回归
    2. 11.2 多元线性回归
    3. 11.3 得到回归统计量
    4. 11.4 理解回归的汇总结果
    5. 11.5 运行无截距项的线性回归
    6. 11.6 只应用与因变量高度相关的变量进行回归
    7. 11.7 运行有交互项的线性回归
    8. 11.8 选择最合适的回归变量
    9. 11.9 对数据子集进行回归
    10. 11.10 在回归公式中使用表达式
    11. 11.11 多项式回归
    12. 11.12 对变换后的数据进行回归
    13. 11.13 寻找最佳幂变换(Box-Cox过程)
    14. 11.14 回归系数的置信区间
    15. 11.15 绘制回归残差
    16. 11.16 线性回归的诊断
    17. 11.17 识别有影响的观察值
    18. 11.18 残差自相关检验(Durbin-Watson检验)
    19. 11.19 预测新值
    20. 11.20 建立预测区间
    21. 11.21 执行单因素方差分析
    22. 11.22 创建交互关系图
    23. 11.23 找到组间均值的差异
    24. 11.24 执行稳健方差分析(Kruskal-Wallis检验)
    25. 11.25 运用方差分析比较模型
  21. 第12章 有用的方法
    1. 12.1 查看你的数据
    2. 12.2 输出赋值结果
    3. 12.3 对行和列求和
    4. 12.4 按列输出数据
    5. 12.5 对数据分组
    6. 12.6 找到特定值的位置
    7. 12.7 每隔n个选定一个向量元素
    8. 12.8 找到最小值或最大值
    9. 12.9 生成多个变量的组合
    10. 12.10 转换一个数据框
    11. 12.11 对数据框排序
    12. 12.12 移除变量属性
    13. 12.13 显示对象的结构
    14. 12.14 代码运行时间
    15. 12.15 避免显示警告和错误消息
    16. 12.16 从列表中提取函数参数
    17. 12.17 定义你自己的二元运算符
    18. 12.18 不显示R启动消息
    19. 12.19 获取和设置环境变量
    20. 12.20 使用代码段
    21. 12.21 本地并行运行R代码
    22. 12.22 远程并行运行R代码
  22. 第13章 高级数值分析和统计方法
    1. 13.1 最小化或者最大化单参数函数
    2. 13.2 最小化或者最大化多参数函数
    3. 13.3 计算特征值和特征向量
    4. 13.4 执行主成分分析
    5. 13.5 执行简单正交回归
    6. 13.6 识别数据的聚类
    7. 13.7 预测二元变量(逻辑回归)
    8. 13.8 统计量的Bootstrap法
    9. 13.9 因子分析
  23. 第14章 时间序列分析
    1. 14.1 表示时间序列
    2. 14.2 绘制时序图
    3. 14.3 提取最早或者最新的观测值
    4. 14.4 选取时间序列的子集
    5. 14.5 合并多个时间序列
    6. 14.6 缺失时间序列的填充
    7. 14.7 时间序列的滞后
    8. 14.8 计算逐次差分
    9. 14.9 时间序列的相关计算
    10. 14.10 计算移动平均
    11. 14.11 在日历时间范围内应用函数
    12. 14.12 应用滚动函数
    13. 14.13 绘制自相关函数图
    14. 14.14 检验时间序列的自相关
    15. 14.15 绘制偏自相关函数
    16. 14.16 两个时间序列间的滞后相关性
    17. 14.17 剔除时间序列的趋势
    18. 14.18 拟合ARIMA模型
    19. 14.19 剔除ARIMA模型中不显著的系数
    20. 14.20 对ARIMA模型进行诊断
    21. 14.21 用ARIMA模型进行预测
    22. 14.22 绘制预测结果
    23. 14.23 均值回归的检验
    24. 14.24 时间序列的平滑
  24. 第15章 简单编程
    1. 15.1 在两种可能情况中进行选择:if/else
    2. 15.2 用循环进行迭代
    3. 15.3 定义一个函数
    4. 15.4 创建局部变量
    5. 15.5 在多种替代方案之间进行选择:switch
    6. 15.6 定义函数参数的默认值
    7. 15.7 给出警示错误的信号
    8. 15.8 防止错误
    9. 15.9 创建匿名函数
    10. 15.10 创建可重复使用函数的集合
    11. 15.11 自动重新生成代码
  25. 第16章 R Markdown和发表
    1. 16.1 创建新文档
    2. 16.2 添加标题、作者或日期
    3. 16.3 格式化文档文本
    4. 16.4 插入文档标题
    5. 16.5 插入列表
    6. 16.6 显示R代码的输出
    7. 16.7 控制显示的代码和结果
    8. 16.8 插入图
    9. 16.9 插入表格
    10. 16.10 插入数据表
    11. 16.11 插入数学公式
    12. 16.12 生成HTML输出
    13. 16.13 生成PDF输出
    14. 16.14 生成Microsoft Word输出 (1/2)
    15. 16.14 生成Microsoft Word输出 (2/2)
    16. 16.15 生成演示输出
    17. 16.16 创建参数化报告
    18. 16.17 组织自定义R Markdown工作流程
  26. 作者简介
  27. 封面介绍

Product information

  • Title: R 语言经典实例(原书第 2 版)
  • Author(s): J.D. Long, Paul Teetor
  • Release date: June 2020
  • Publisher(s): China Machine Press
  • ISBN: 9787111656814

You might also like

book

数字化转型:企业破局的34 个锦囊

by Gary O’Brien, Xiao Guo, Mike Mason

数字化时代正在对各行各业产生广泛而深远的影响。不是简单地将自动化或数字技术嵌入现有产品中去,而是需要重新考虑一切。在这本实操性质的书中,ThoughtWorks的三名专业人士提供了34个锦囊,帮助企业跨越转型,同时提供了相关的技术概念,助力你成为现代数字业务中的高效领导者。 本书包含丰富的实用性建议和案例研究,展示了企业是如何转型的,还揭示了指导企业数字化转型的相关经验教训。虽然转型没有银弹可用,但你将找到在组织中推行变革的有效方法。 通过阅读本书,你将了解: 如何重新调整业务和运营架构,关注客户价值。 如何建立一个响应更快、更敏捷的组织来应对发展速度和环境的不确定性。 如何构建下一代技术能力来作为企业的核心竞争力。

book

复杂性思考:复杂性科学和计算模型(原书第2 版)

by Allen B. Downey

复杂性科学使用计算来探索物理和社会科学。在本书中,你将使用图表、元胞自动机以及基于智能体的模型来研究物理学、生物学和经济学。 无论你是中等水平的Python程序员还是希望学习计算机建模的学生,都可以通过一系列工作示例、练习、案例研究和易于理解的解释深入学习复杂系统。 在更新后的第2版中,你将: 使用NumPy数组和SciPy方法,包括基本信号处理和快速傅里叶变换。 研究复杂物理系统的抽象模型,包括幂律、分形、粉红噪声和图灵机。 获取包含入门代码和解决方案的Jupyter笔记本,以便重复实现和扩展原始实验的复杂性以及计算模型,如Turmite、图灵机和元胞自动机。 探索科学中的哲学,包括科学规律的本质、理论选择,以及现实主义和工具主义。 作为Python编程与算法的理想教材,本书还有助于自学者掌握关于他们可能未曾谋面的主题与想法的宝贵经验。

book

数据库系统内幕

by Alex Petrov

当我们选择、使用并维护一个数据库系统时,理解它的原理至关重要。但是现今有太多的分布式数据库和工具可供使用,要想弄明白每一种工具的作用以及它们之间的区别往往并不容易。在这本实用指南中,作者讲解了现代数据库和存储引擎背后的概念。 通过本书,你将领略到从众多书籍、论文、博客和多个开源数据库源代码中精心选取的相关材料,并且了解到众多现代数据库之间最重要的区别在于决定存储结构和数据分布的子系统。 你将深入了解如下内容: 存储引擎:学习存储的种类、分类依据,理解基于B树和不可变日志存储结构的存储引擎。 存储构建块:理解数据库文件如何使用诸如页缓存、缓冲池等辅助数据结构来组织构建高效的存储。 分布式系统:逐步学习节点和进程间如何连接并构建复杂的通信模式。 数据库集群:深入探究现在数据库中常用的一致性模型,并了解分布式存储系统是如何实现一致性的。

book

数据库可靠性工程:数据库系统设计与运维指南

by Laine Campbell, Charity Majors

信息技术领域的基础设施即代码革命正在影响着数据库管理。本书从实践角度介绍如何将网站可靠性工程的实践应用于数据库架构和运维,为想成为数据库可靠性工程师的专业人士提供一个指导框架,开发人员、系统管理员和初中级数据库管理员等都能从中受益。 本书首先介绍数据库可靠性工程师需要掌握的核心运维概念,然后介绍各种数据库持久性选项,包括如何利用关键技术提供有弹性、可扩展、高性能的数据存储和检索。有了数据库可靠性工程的坚实基础,读者便能深入研究任何现代数据库的架构和运维。 服务等级要求和风险管理 构建并演进具有运维可见性的架构 基础设施工程和基础设施管理 如何推动发布管理流程 数据存储、索引和复制 明确数据存储的特性和用例 数据存储架构组件和数据驱动的架构