第1章 Python机器学习实践入门

在技术行业,分析和挖掘商业数据的技能正变得越来越重要。公司若有线上业务,可开发利用线上产生的数据,以改进自身业务,或将数据出售给其他公司。重组或分析这些可能具有商业价值的海量信息,只有掌握专业知识的数据科学(或数据挖掘)专业人士才能做得到。数据科学采用机器学习技术将数据转化为模型,以便预测业务领域高度重视的特定实体的行为。这些算法和技术在当今以技术为主导的业务领域是必不可少的。本书讲解这些算法和技术,并介绍如何将其部署到真实的商业环境。你将学到最常用的机器学习技术,并有机会在一系列旨在提高商业智能的练习和应用中使用它们。从本书学到的技能,可用于实际工作。为了充分掌握书中所讨论的各个主题,我们希望你已熟悉Python编程语言、线性代数和统计方法。

  • 网上有很多关于这些主题的教程和课程,但我们建议你阅读Python官方文档(https://docs.python.org/),阅读A. Bluman的Elementary Statistics以及由G. Casella和R. L. Berger合著的Statistical Inference,理解主要的统计概念和方法。学习线性代数,可阅读G. Strang所写的Linear Algebra and Its Applications

本章作为入门章节,目的是让你熟悉Python机器学习的专业人士所使用的更为高级的库和工具,比如NumPy、pandas和matplotlib,帮你掌握必要技术知识,以便实现后续章节的各种技术。讲解本书所用库之前,我们先来阐明机器学习领域的主要概念,并通过一个实例,展示在真实场景中机器学习算法如何给出有用的预测信息。

本书讨论最常用的机器学习算法,并在练习中加以运用,从而使你熟悉它们。为了解释这些算法,帮你理解本书内容,我们先大体看下几个常用概念,后面会详细介绍。 ...

Get Web机器学习 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.