前言
数据科学,尤其是机器学习,成为当下科技商业领域人们热议的议题。这类技术可用来处理用户产生的、数量在不断增长的数据。本书将讲解如何用Python语言、Django框架开发一款Web商业应用,还将讲解如何用一些现成的库(sklearn、scipy、NLTK和Django等)处理和分析(通过机器学习技术)应用生成或使用的数据。
本书主要内容
第1章,Python机器学习实践入门,讨论机器学习的主要概念以及数据科学专业人士用Python处理数据所使用的几个库。
第2章,无监督机器学习,讲解为数据集分簇和从数据中抽取主要特征所用到的算法。
第3章,有监督机器学习,讲解预测数据集标签最常用的有监督机器学习算法。
第4章,Web挖掘技术,讨论Web数据的组织、分析和从中提取信息的主要技术。
第5章,推荐系统,详细介绍当今商业领域所使用的几种最流行的推荐系统。
第6章,开始Django之旅,介绍开发Web应用所用到的Django的主要功能和特点。
第7章,电影推荐系统Web应用,将介绍的机器学习概念付诸实践,动手实现为Web用户推荐电影的应用。
第8章,影评情感分析应用,再次通过一个实例,使用讲述的知识,分析在线影评的情感倾向和相关性。
本书的阅读前提
读者应该准备一台计算机,装好Python 2.7,能够运行(和修改)书中各章讲解的代码。
本书的目标读者
任何有一定编程经验(Python)和统计学背景,对机器学习感兴趣和/或希望从事数据科学职业的读者均可从本书受益。
排版约定
本书使用不同的文本样式来区分不同类别的内容。以下是常用样式及其用途说明。
正文中的代码、数据库表名、文件夹名、文件名、文件扩展名、路径名、URL地址、用户输入的内容和Twitter用户名显示方式如下:
“在终端输入以下命令,安装Django这个库:sudo ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access