Skip to Content
Tableau Prep即学即用
book

Tableau Prep即学即用

by Carl Allchin
August 2022
Beginner to intermediate
463 pages
9h 22m
Chinese
China Electric Power Press Ltd.
Content preview from Tableau Prep即学即用
连接文件中的数据
49
心的问题。所有这些类型文件的创建和使用都有多种原因。通常情况下,它们来自
不同程序的默认输出,在这些程序中,正在使用所在组织的数据处理或分析工具。
让我们仔细看看这些文件以及它们的来源:
CSV
Comma-Separated Value
,逗号分隔值)
这些文件可以作为数据存储文件输出。无论是为非微软
Office
套件中的程序共
享数据,还是简单地将数据移入数据库,
CSV
都是非常灵活的文件类型。数据
列由逗号分隔(因此而得名),新的数据行列在文件内的单独行上。
CSV
实际
上是一个文本文件,但有一个固定的分隔符。
文本文件
虽然这些文件适合以非常简单的格式保存数据,但由于它们能够包含不同的结
构和数据格式,因此有可能在工作中出现问题。通常情况下,文本文件会以某
种方式进行分隔,但这种格式并不总是一致的,也不像
CSV
文件那样容易使用。
统计文件
越来越多的大学开始教授
R
语言和
Python
语言。因此,在工作场所中对这些文
件类型的需求越来越多,特别是数据科学家和其他从事
R
Python
模型,以及
使用相关软件包来完成统计工作的人。
PDF
Portable Document Format
,便携式文档格式)
这种常用的文件格式往往包含了有用的数据集。
PDF
的创建方式和数据组织格
式,使得在数据准备流程以提取其数据时,其容易程度有很大的不同。例如,
如果一个表格是作为图像创建的,那么它的单元格就不能作为数据字段和值来
读取,但如果它是作为一个列和行的网格创建的,那么它们就可以被读取。
5.2
在哪里可以找到你的数据文件 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

深度学习:核心原理与案例分析

深度学习:核心原理与案例分析

Posts & Telecom Press, Ahmed Menshawy
Python金融实战

Python金融实战

Posts & Telecom Press, Yuxing Yan
Python机器学习案例精解

Python机器学习案例精解

Posts & Telecom Press, Yuxi (Hayden) Liu
HBase管理指南

HBase管理指南

Posts & Telecom Press, Yifeng Jiang

Publisher Resources

ISBN: 9787519864439