第1章 Anaconda生态系统

在前言中,我们提到本书是为那些寻找数据科学领域工具的读者而设计。对于那些希望通过使用多种语言的最佳工具来提高数据科学应用效率的数据分析师和数据科学专业人士来说,本书也有很大的参考价值。我们将分章节详细讨论Anaconda平台,以及PythonR、JuliaOctave等计算工具。由于这些编程语言都是开源且可自由下载的,所以这将为读者带来诸多便利。在本章中,我们将从最简单的介绍开始。针对本书,我们假设读者已经掌握了这几种编程语言(例如R和Python)的一些基础知识。此外,还有很多书可供读者学习,例如Python for Data AnalysisPython for Finance

本章包含以下主题:

  • 简介
  • Miniconda
  • Anaconda云
  • 查找帮助

当前,我们正被大量的信息所淹没,即当前的流行语“大数据”。然而,由于当前对“大数据”存在很多种解释,所以它的定义仍然具有争议。Davenport和Patil建议,如果你的组织存储了大量PB(拍字节)级别的数据,如果最重要的业务信息并非以数字的行和列的形式存在,或者如果解决问题需要结合多项分析工作,那么你已经面临着大数据带来的挑战和机遇。

目前,虽然很多数据科学或数据分析的用户正在学习多种编程语言,例如R和Python,但是他们如何同时使用这两种语言呢?打个比方,如果约翰当前使用R语言,而他的队友则使用Python,那么他们之间如何交流呢?团队成员如何共享他们的包、程序,甚至他们的工作环境呢?由于Anaconda拥有一些神奇的特性,所以在本书中,我们将通过介绍Anaconda来尽力为这些挑战性任务提供一个解决方案。

通常来说,R是一种用于统计计算和绘制图形的编程语言,它由R统计计算基金会支持。而Python则是一种类似于Perl的解释性的、面向对象的编程语言。Python语法清晰、可读性强,因此备受用户欢迎。此外,Julia擅长数值计算并包含大量的数学函数,可以用来进行并行计算和云计算。而Octave是用于数值计算以及面向数学和批处理的语言。最后,R、Python、Julia和Octave这4种语言都是免费的。 ...

Get Anaconda数据科学实战 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.