
9
第 1 章
Trino 介绍
你也许听说过
Trino
,然后找到了本书,或者你正在浏览第
1
章的内容,以便决定是否
继续研读。本章将讨论快速增长的海量数据带来的诸多问题,以及隐藏在这些数据中的
价值,也会提及
Trino
是通过结构化查询语言(
Structured Query Language
,
SQL
)来处
理和访问所有数据的重要推动者。
Trino
的设计和特性能让你获得更好的洞见,你可以更快地获得那些之前需要更高的成
本或更长的时间才能获得的信息。同时,使用更少的资源并因此节省了预算。利用节省
下来的资源,你可以学到更多!
虽然我们也会介绍本书之外的更多资源,但希望你先从本书开始学习。
1.1
大数据带来的问题
每个人都在采集越来越多的数据,这些数据涉及设备指标、用户行为跟踪、商业交易、
地理位置、软件及系统测试程序和工作流等。从这些数据所获得的洞见,能够决定一个
创业项目乃至一家公司的成败。
同时,数据存储机制日益多样:关系型数据库、
NoSQL
数据库、文档数据库、键值存储
和对象存储系统等。对于当今的组织结构,它们当中很多是必备的,只使用其中一种已
经不够了。应对如图
1-1
所示的情形是一项令人生畏的艰巨任务。
此外,这些不同的系统不允许你使用标准工具来查询和检视数据。面向特定系统的查询
语言和分析工具比比皆是。与此同时,你的商业分析师已习惯使用业界标准
—
SQL
,
无数强大的工具依赖
SQL
来分析数据、创建仪表盘、制作丰富的报告以及完成其他商业
智能工作。
Trino权威指南 1-6.indd 9Trino权威指南 1-6.indd ...