Skip to Content
Java数据分析指南
book

Java数据分析指南

by Posts & Telecom Press, John R. Hubbard
May 2024
Intermediate to advanced
347 pages
5h 38m
Chinese
Packt Publishing
Content preview from Java数据分析指南

第1章 数据科学导论

数据分析是对数据进行组织、清洗、转换和建模的过程,目的是获取有价值的信息和新知识。数据分析、商业分析、数据挖掘、人工智能、机器学习、知识发现和大数据,这些术语也可以用来描述相似的过程。这些领域之间的区别更多体现在应用领域,而非基础本质。有人认为,这些领域都是数据科学新学科的一部分。

在从组织化数据中获取有效信息的过程中,关键步骤是应用计算机科学算法进行管理。而本书的重点就是这些算法。

数据分析是一个历久弥新的领域。它起源于数值方法和统计分析的数学领域,可以追溯至18世纪。近年来,随着互联网愈加普遍和海量数据逐渐可得,许多数据科学方法受到越来越多的关注,随后我们将研究这些算法。

在第1章中,我们来讲述数据分析史上的一些著名案例。这些案例可以帮助我们理解这门科学的重要性和未来前景。

数据与文明一样历史悠久,甚至年代更为古老。1.7万年前,法国拉斯科的原始居民为了纪念他们最伟大的狩猎胜利,尝试以洞穴壁画的形式记录这些胜利。这些记录为我们提供了旧石器时代人类活动的数据。从现代意义上讲,这些数据并没有被分析,也没有为我们提供新知识。但是,这些数据的存在本身就证明了人类需要使用数据保存自己的思想。

5000年前,美索不达米亚的苏美尔人在泥板上记录了更为重要的数据。那些楔形文字记录了与日常商业交易相关的大量会计数据。为了运用数据,苏美尔人不仅发明了文字,还发明了人类文明史上的第一个数字系统。

在1086年,威廉国王(译者注:1066年,诺曼底公爵威廉征服英格兰)为了确定王室和臣民的土地与财产范围,下令收集大量数据。因为这是对人们(物质)生活的最终盘点,因此被称为“末日审判书”。威廉国王分析这些数据,并确定了随后几个世纪中土地的所有权和纳税义务。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python实用技能学习指南

Python实用技能学习指南

Posts & Telecom Press, Robert Smallshire, Austin Bingham
Python计算机视觉和自然语言处理

Python计算机视觉和自然语言处理

Posts & Telecom Press, Álvaro Morena Alberolaï, Gonzalo Molina Gallegoï, Unai Garay Maestreï
Python和NLTK实现自然语言处理

Python和NLTK实现自然语言处理

Posts & Telecom Press, Nitin Hardeniya
Python设计模式(第2版)

Python设计模式(第2版)

Posts & Telecom Press, Chetan Giridhar

Publisher Resources

ISBN: 9781836201052