前言
Anaconda是一个开源的数据科学平台,它将数据科学中的好工具集中在一起。它是一个数据科学栈,包含100多个基于Python、Scala和R的工具包。在它的包管理器conda的帮助下,用户能够使用数百个不同语言的包,并轻松地进行数据预处理、建模、聚类、分类和验证。
本书将带领你学习Anaconda,并教你如何使用它在现实世界中执行数据科学操作。首先,你将为Anaconda、Jupyter搭建环境,并安装相关的软件包。然后,学习数据科学基础和线性代数,为执行数据科学任务做准备。一旦准备完毕,你将开始进行数据科学操作,例如清理、排序和数据分类。接着,你将学习如何执行数据科学任务,例如聚类、回归、预测、创建机器学习模型并优化它们。此外,你也会学习如何可视化数据及共享项目。
在本书中,你将学习如何在Anaconda平台上使用不同的软件包获得最佳结果。你还将学习如何有效地使用conda——Anaconda的包管理器。另外,书中还将介绍Anaconda的几个强大特性,例如附加项目、项目附加组件、共享项目驱动以及强大的计算节点,这些节点存在于付费版本中,可用来完成高级数据处理流程。此外,你将学习如何构建可伸缩的和功能强大的包,以及如何进行各种各样的数据探索、分布式计算等。你还将通过发现和共享包、Notebook和环境来提高工作效率。最后,你还将学习Anaconda的加速,这是一种能够帮助你轻松优化计算能力的特性。
在本书中,我们将介绍4种编程语言——R、Python、Octave和Julia,这样做有几个原因。首先,这4种语言都是开源的,这是未来的一个趋势。其次,使用Anaconda平台最明显的优势之一就是我们可以实现用多种语言编写程序。然而,对于很多初学者来说,同时学习4种语言会很有挑战性,所以最好的策略是先关注R和Python。一段时间后,或者读完整本书后,再学习Octave或Julia。 ...
Get Anaconda数据科学实战 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.