Book description
本书提供了约200个独立的解决方案,来帮助你解决在日常开发中可能遇到的机器学习方面的问题。如果你熟悉Python和它的库(包括Pandas和scikit-learn),你就能应对加载数据、处理文本或数值型数据、模型选择、降维等特定问题。
书中的每个解决方案都给出了相应的代码,你可以直接把它们复制并粘贴到测试数据集中,看看它们是否能正常运行。接下来,你还可以对这些代码进行插入、组合和修改操作,以构建自己的应用。除了代码,书中还对每个解决方案进行了讨论,解释其原理并介绍相关的背景知识。本书的重点不在于讲解机器学习的理论和概念,而在于帮助你掌握构建实用的机器学习应用的要点。
本书包含如下方面的解决方案:
- 向量、矩阵和数组
- 处理数值型数据和分类数据,处理文本、图像,处理时间和日期
- 用特征提取或特征选择方法进行降维
- 模型的评估及选择
- 线性回归和逻辑回归、树和森林、K近邻
- 支持向量机(SVM)、朴素贝叶斯、聚类和神经网络
- 保存和加载训练后的模型
Table of contents
Product information
- Title: Python机器学习手册:从数据预处理到深度学习
- Author(s):
- Release date: July 2019
- Publisher(s): Publishing House of Electronics Industry
- ISBN: 9787121369629
You might also like
book
数据科学中的实用统计学(第2版)
统计方法是数据科学的重要组成部分,但鲜有数据科学从业人员接受过正规的统计学教育或培训,而关于统计学基础的课程和教材又很少从数据科学的角度讲解。本书以通俗易懂、分门别类的方式,专门从数据科学的角度系统地阐释重要且实用的统计学概念,侧重于介绍如何将各种统计方法应用于数据科学。 Python和R都是数据科学从业人员常用的语言。与第1版相比,本书第2版新增了更多Python示例。你将能够更全面地了解如何在数据科学项目中正确运用各种统计方法,系统梳理数据科学中的核心统计学概念,透彻理解哪些统计学概念重要、哪些不那么重要,以及为什么是这样。此外,本书还可以帮助你充分准备好应对数据科学面试。 通过本书,你将掌握以下知识。 为什么探索性数据分析是开启数据科学任务的关键一步 随机抽样如何降低偏差并提高数据集的质量 实验设计原则如何针对问题生成确定性答案 如何使用回归方法估计结果并检测异常 用于预测记录所属类别的主要分类方法 从数据中“学习”的统计机器学习方法 从未标记的数据中提取信息的无监督学习方法
book
精通機器學習
建立智慧系統的概念、工具與技術 “這是一本卓越的機器學習資源,有清楚、直觀的解說,以及大量實用技巧。” —François Chollet Keras作者,《Deep Learning with Python》作者 “這本書詳細介紹以神經網路解決問題的理論與做法;建議想要實際運用ML的人都要看這本書。” —Pete Warden TensorFlow行動主管 深度學習經歷了一系列的突破之後,已經大幅推動了整個機器學習領域,如今,即使你對這項技術一無所知,也可以使用簡單、高效的工具,製作可從資料中學習的程式。這本暢銷書新版本使用具體的案例、精簡的理論,以及Python準生產框架,協助你直觀地認識智慧系統的概念與建構工具。 你將學到可快速上手的技術,只要具備程式編寫經驗,就可以藉由各章的習題來學習。你可以在GitHub取得本書的所有程式碼,這些程式已經更新為TensorFlow 2,以及最新版的Scikit-Learn。 使用Scikit-Learn與pandas,透過端對端專案建立機器學習基礎 …
book
管理Kubernetes
虽然Kubernetes极大地简化了部署容器化应用程序的工作,但每天管理这种编排框架仍然是一项复杂的工作。站点管理人员以及 开发运营工程师可以通过本书学习如何构建、操作、管理及升级 Kubernetes集群,无论这些集群位于云基础架构之上还是在企业内部。 本书的作者Brendan Burns是Kubernetes的联合创始人,而Craig Tracey 是Heptio的现场工程师。本书详细讲解了Kubernetes的内部工作原理,并向读者展示了如何通过维护、调整和改善集群来满足特定需求。你可以通过本书学习如何从设计集群、管理访问控制、监视和报警,以及升级Kubernetes等方面来综合考虑架构的选择,还可以 通过本书深入了解如何充分利用这种编排框架的功能。 “学习如何操作集群,开发人员如何利用Kubernetes部署应用程序,以及如何利用Kubernetes减轻开发人员的负担。 通过掌握Kubernetes API以及配置选项来调整、保护,以及调节集群。 检测集群级别的问题,学习必要的响应步骤并快速恢复集群。 确定如何以及何时添加构建、扩展或以其他方式改进 Kubernetes集群的库、工具和平台。
book
Python数据科学手册
Python语言拥有大量可用于存储、操作和洞察数据的程序库,已然成为深受数据科学研究人员推崇的工具。本书以IPython、NumPy、 Pandas、Matplotlib和Scikit-Learn这5个能完成数据科学大部分工作的基础工具为主,从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务,旨在让与数据处理相关的各领域的工作人员具备发现问题、解决问题的能力。 IPython和Jupyter:为使用Python提供计算环境。 NumPy:用ndarray实现高维数组的高效存储与操作。 Pandas:用DataFrame实现带标签/列式数据的高效存储与操作。 Matplotlib:实现各种数据可视化。 Scikit-Learn:用高效整洁的Python实现重要的机器学习算法。