Python数据分析

Book description

学习流行的开源Python模块,掌握强大的数据分析技术

Key Features

  • 最实用的Python开源模块的大集合;
  • 简单易懂、示例丰富的数据分析教程;
  • 掌握数据可视化、机器学习等高端主题;
  • 新手变身数据分析专家的最佳读本;

Book Description

作为一种高级程序设计语言,Python凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。

本书是一本介绍如何用Python进行数据分析的学习指南。全书共12章,从Python程序库入门、NumPy数组、matplotlib和pandas开始,陆续介绍了数据加工、数据处理和数据可视化等内容。同时,本书还介绍了信号处理、数据库、文本分析、机器学习、互操作性和性能优化等高级主题。在本书的最后,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。

本书示例丰富、简单易懂,非常适合对Python语言感兴趣或者想要使用Python语言进行数据分析的读者参考阅读。

What you will learn

  • Python程序库
  • NumPy数组
  • matplotlib
  • pandas
  • 数据加工
  • 数据处理
  • 数据可视化
  • 信号处理
  • 数据库
  • 文本分析
  • 机器学习
  • 互操作性
  • 性能优化

Who this book is for

Python编程人员、数据分析人员、计算机专业学生

Table of contents

  1. 版权信息
  2. 作者简介
  3. 版权声明
  4. 内容提要
  5. 前言
    1. 本书内容
    2. 本书需要的资源
    3. 目标读者
    4. 排版约定
    5. 读者反馈
    6. 客户支持
    7. 下载示例代码
    8. 勘误
    9. 关于盗版行为
    10. 疑问解答
  6. 技术评审简介
  7. 第1章 Python程序库入门
    1. 1.1 本书用到的软件
      1. 1.1.1 软件的安装和设置
      2. 1.1.2 Windows平台
      3. 1.1.3 Linux平台
      4. 1.1.4 Mac OS X平台
    2. 1.2 从源代码安装NumPy、SciPy、matplotlib和IPython
    3. 1.3 用setuptools安装
    4. 1.4 NumPy数组
    5. 1.5 一个简单的应用
    6. 1.6 将IPython用作shell
    7. 1.7 学习手册页
    8. 1.8 IPython notebook
    9. 1.9 从何处寻求帮助和参考资料
    10. 1.10 小结
  8. 第2章 NumPy数组
    1. 2.1 NumPy数组对象
      1. NumPy数组的优势
    2. 2.2 创建多维数组
    3. 2.3 选择NumPy数组元素
    4. 2.4 NumPy的数值类型
      1. 2.4.1 数据类型对象
      2. 2.4.2 字符码
      3. 2.4.3 Dtype构造函数
      4. 2.4.4 dtype属性
    5. 2.5 一维数组的切片与索引
    6. 2.6 处理数组形状
      1. 2.6.1 堆叠数组
      2. 2.6.2 拆分NumPy数组
      3. 2.6.3 NumPy数组的属性
      4. 2.6.4 数组的转换
    7. 2.7 创建数组的视图和拷贝
    8. 2.8 花式索引
    9. 2.9 基于位置列表的索引方法
    10. 2.10 用布尔型变量索引NumPy数组
    11. 2.11 NumPy数组的广播
    12. 2.12 小结
  9. 第3章 统计学与线性代数
    1. 3.1 Numpy和Scipy模块
    2. 3.2 用NumPy进行简单的描述性统计计算
    3. 3.3 用NumPy进行线性代数运算
      1. 3.3.1 用NumPy求矩阵的逆
      2. 3.3.2 用NumPy解线性方程组
    4. 3.4 用NumPy计算特征值和特征向量
    5. 3.5 NumPy随机数
      1. 3.5.1 用二项式分布进行博弈
      2. 3.5.2 正态分布采样
      3. 3.5.3 用SciPy进行正态检验
    6. 3.6 创建掩码式NumPy数组
      1. 忽略负值和极值
    7. 3.7 小结
  10. 第4章 pandas入门
    1. 4.1 pandas的安装与概览
    2. 4.2 pandas数据结构之DataFrame
    3. 4.3 pandas数据结构之Series
    4. 4.4 利用pandas查询数据
    5. 4.5 利用pandas的DataFrame进行统计计算
    6. 4.6 利用pandas的DataFrame实现数据聚合
    7. 4.7 DataFrame的串联与附加操作
    8. 4.8 连接DataFrames
    9. 4.9 处理缺失数据问题
    10. 4.10 处理日期数据
    11. 4.11 数据透视表
    12. 4.12 访问远程数据
    13. 4.13 小结
  11. 第5章 数据的检索、加工与存储
    1. 5.1 利用NumPy和pandas对CSV文件进行写操作
    2. 5.2 NumPy.npy与pandas DataFrame
    3. 5.3 使用PyTables存储数据
    4. 5.4 Pandas DataFrame与HDF5仓库之间的读写操作
    5. 5.5 使用pandas读写Excel文件
    6. 5.6 使用REST Web服务和JSON
    7. 5.7 使用pandas读写JSON
    8. 5.8 解析RSS和Atom订阅
    9. 5.9 使用Beautiful Soup解析HTML
    10. 5.10 小结
  12. 第6章 数据可视化
    1. 6.1 matplotlib的子库
    2. 6.2 matplotlib绘图入门
    3. 6.3 对数图
    4. 6.4 散点图
    5. 6.5 图例和注解
    6. 6.6 三维图
    7. 6.7 pandas绘图
    8. 6.8 时滞图
    9. 6.9 自相关图
    10. 6.10 Plot.ly
    11. 6.11 小结
  13. 第7章 信号处理与时间序列
    1. 7.1 statsmodels子库
    2. 7.2 移动平均值
    3. 7.3 窗口函数
    4. 7.4 协整的定义
    5. 7.5 自相关
    6. 7.6 自回归模型
    7. 7.7 ARMA模型
    8. 7.8 生成周期信号
    9. 7.9 傅里叶分析
    10. 7.10 谱分析
    11. 7.11 滤波
    12. 7.12 小结
  14. 第8章 应用数据库
    1. 8.1 基于sqlite3的轻量级访问
    2. 8.2 通过pandas访问数据库
    3. 8.3 SQLAlchemy
      1. 8.3.1 SQLAlchemy的安装和配置
      2. 8.3.2 通过SQLAlchemy填充数据库
      3. 8.3.3 通过SQLAlchemy查询数据库
    4. 8.4 Pony ORM
    5. 8.5 Dataset:懒人数据库
    6. 8.6 PyMongo与MongoDB
    7. 8.7 利用Redis存储数据
    8. 8.8 Apache Cassandra
    9. 8.9 小结
  15. 第9章 分析文本数据和社交媒体
    1. 9.1 安装NLTK
    2. 9.2 滤除停用字、姓名和数字
    3. 9.3 词袋模型
    4. 9.4 词频分析
    5. 9.5 朴素贝叶斯分类
    6. 9.6 情感分析
    7. 9.7 创建词云
    8. 9.8 社交网络分析
    9. 9.9 小结
  16. 第10章 预测性分析与机器学习
    1. 10.1 scikit-learn概貌
    2. 10.2 预处理
    3. 10.3 基于逻辑回归的分类
    4. 10.4 基于支持向量机的分类
    5. 10.5 基于ElasticNetCV的回归分析
    6. 10.6 支持向量回归
    7. 10.7 基于相似性传播算法的聚类分析
    8. 10.8 均值漂移算法
    9. 10.9 遗传算法
    10. 10.10 神经网络
    11. 10.11 决策树
    12. 10.12 小结
  17. 第11章 Python生态系统的外部环境和云计算
    1. 11.1 与MATLAB/Octave交换信息
    2. 11.2 Installing rpy2安装rpy2
    3. 11.3 连接R
    4. 11.4 为Java传递NumPy数组
    5. 11.5 集成SWIG和NumPy
    6. 11.6 集成Boost和Python
    7. 11.7 通过f2py使用Fortran代码
    8. 11.8 配置谷歌应用引擎
    9. 11.9 在PythonAnywhere上运行程序
    10. 11.10 使用Wakari
    11. 11.11 小结
  18. 第12章 性能优化、性能分析与并发性
    1. 12.1 代码的性能分析
    2. 12.2 安装Cython
    3. 12.3 调用C代码
    4. 12.4 利用multiprocessing创建进程池
    5. 12.5 通过Joblib提高for循环的并发性
    6. 12.6 比较Bottleneck函数与NumPy函数
    7. 12.7 通过Jug实现MapReduce
    8. 12.8 安装MPI for Python
    9. 12.9 IPython Parallel
    10. 12.10 小结
  19. 附录A 重要概念
  20. 附录B 常用函数
    1. matplotlib
    2. Numpy
    3. pandas
    4. scikit-learn
    5. sciPy
      1. scipy.fftpack
      2. scipy.signal
      3. scipy.stats
  21. 附录C 在线资源
  22. 看完了

Product information

  • Title: Python数据分析
  • Author(s): Posts & Telecom Press, Ivan Idris
  • Release date: May 2024
  • Publisher(s): Packt Publishing
  • ISBN: 9781836206958

You might also like

book

编写整洁的Python代码(第2版)

by Posts & Telecom Press, Mariano Anaya

Python代码整洁之道 Key Features 介绍实现Python代码整洁应遵循的基本原则 涵盖避免由不良代码导致的效率低下以及存在诸多隐患的代码的方法 作者专业背景深厚,项目经验丰富 基于Python 3.9 Book Description 这是一本介绍如何实现Python代码整洁的书,主要介绍如何使用Python 3.9引入的新特性提升编码技能。此外,本书还介绍了以下内容:通过利用自动化工具建立高效的开发环境,利用Python中的魔法方法来编写更好的代码,抽象代码复杂性并封装细节,使用Python特有的特性创建高级的面向对象设计,通过使用面向对象设计的软件工程原则创建强大的抽象来消除代码重复,使用装饰器和描述符创建特定于Python的解决方案,运用单元测试方法有效重构代码,以及通过实现整洁的代码库为构建坚实的架构打下基础等。 本书对新手程序员和有经验的程序员同样适用,也适合想通过编写Python代码来节省成本和提高效率的团队领导、软件架构师和高级软件工程师参考。当然在阅读本书前,读者应掌握一些Python基础知识。 What you will …

book

时间序列分析实战:基于机器学习和统计学

by Aileen Nielsen

天气、股票、心跳都会产生时间序列数据,物联网、数字化医疗和智慧城市的兴起更是产生了大量的时间序列数据。随着数据的规模快速增长,应用机器学习和统计方法进行时间序列分析的做法越来越普遍,也越来越重要。 本书从实战角度介绍时间序列分析中的创新技术和实际用例,帮助你结合使用传统的统计方法和先进的机器学习技术来解决时间序列分析中的常见问题。由于Python和R都是时间序列分析常用的语言,因此本书兼顾这两种语言并对时间序列进行全面的阐释,可以让数据分析师、数据工程师和其他与数据打交道的读者快速上手。 发现并整理时间序列数据 针对时间序列进行探索性数据分析 模拟时间序列 存储时间序列 为时间序列生成并选择特征 测量误差 使用机器学习和深度学习分析时间序列 评估模型的精度和性能

book

Python算法交易实战

by Posts & Telecom Press, Sebastien Donadio

金融科技系列图书新作,了解经典实用的算法交易策略,构建自己的算法交易系统,赢在金融交易起跑线(送配套源代码和彩图资源) Key Features 由浅入深地讲解算法交易的相关知识 从基础知识和环境配置讲起 讲解如何通过编程完成交易信息的生成与交易策略的实施 介绍众多算法交易策略,以及如何管理算法策略中的风险 带领读者用Python建立自己交易系统 Book Description 本书由浅入深地讲解了算法交易的相关知识,首先从基础知识和环境配置讲起,其次讲解如何通过编程完成交易信息的生成与交易策略的实施,随后介绍众多算法交易策略,以及如何管理算法策略中的风险,最后带领读者用Python建立自己交易系统,并迎接算法交易的深层挑战。 全书共分为10章,包括算法交易的基础原理、通过技术分析解读市场、通过基础机器学习预测市场、人类直觉驱动的经典交易策略、复杂的算法策略、管理算法策略中的风险、用Python构建交易系统、连接到交易所、在Python中创建回测器、适应市场参与者和环境。 What you will learn …

book

Python计算机视觉和自然语言处理

by Posts & Telecom Press, Álvaro Morena Alberolaï, Gonzalo Molina Gallegoï, Unai Garay Maestreï

用Python学习自然语言处理和计算机视觉技术,用ROS开发智能的机器人系统 Key Features 用Python讲解自然语言处理技术和计算机视觉技术; 用ROS开发更智能的机器人系统; 用NLP技术和OpenCV技术让机器人更加智能; 一系列练习和实战项目全方位提升读者的动手能力和研发能力; 配套的代码资源包和彩色图片包,让你边学边对照,学习效率更高。 Book Description 机器人是人工智能时代的重要产物,为人类的工作和生活提供了非常多的助力。对于智能机器人而言,视觉识别能力和对话能力是非常重要的两个方面,本书就是基于这两个技术展开介绍,并通过一系列的编程案例和实践项目,引导读者高效掌握机器人的开发技巧。 本书基于Python语言进行讲解,结合机器人操作系统(ROS)平台给出了丰富多样的机器人开发方案。本书立足于机器人的视觉和语言处理,通过OpenCV、自然语言处理、循环神经网络、卷积神经网络等技术提高机器人的视觉识别能力和对话能力。全书包括多个练习和项目,通过知识点和编程实践相结合的方式,快速带领读者掌握实用的机器人开发技术。 本书适合机器人或智能软硬件研发领域的工程师阅读,也适合高校人工智能相关专业的师生阅读。 What you will …