Skip to Content
Presto实战
book

Presto实战

by Matt Fuller, Manfred Moser, Martin Traverso
March 2021
Intermediate to advanced
265 pages
6h 50m
Chinese
Posts & Telecom Press
Content preview from Presto实战
102
7
)
WITH
external = true,
column_mapping = 'origin:location:origin,dest:location:dest'
);
7.2.2
 
Accumulo
中的谓词下推
Accumulo
连接器中,
Presto
可以利用
Accumulo
内置的二级索引。为了实现这一点,
Accumulo
连接器需要在每个
tablet
服务器上建立一个自定义的服务器端迭代器
。该迭代器
JAR
文件的形式分发
,你必须将其复制到每个
tablet
服务器上的
$ACCUMULO_HOME/
lib/ext
目录中。你可以在
Presto
文档中找到具体做法。
Accumulo
中的索引用于查询行
ID
,行
ID
用来读取实际表中的值。让我们来看一个例子。
SELECT flightnum, origin
FROM flights
WHERE flightdate BETWEEN DATE '2019-10-01' AND 2019-11-05'
AND origin = 'BOS';
在没有索引的情况下,
Presto
会从
Accumulo
中读取整个数据集,然后在
Presto
内部进行
过滤。要读取的
Accumulo
围被分配给各个工作节点,这里的范围是整个
tablet
的范围。
如果有索引(如表
7-3
中的示例索引)
,处理范围的数量就可以大大减少。
7-3:航班表上的索引示例
2019-08-10 flightdate_flightdate:2232 []
2019-10-19 flightdate_flightdate:2232 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Google系统架构解密: 构建安全可靠的系统

Google系统架构解密: 构建安全可靠的系统

Heather Adkins, Betsy Beyer, Paul Blankinship, Piotr Lewandowski, Ana Oprea, Adam Stubblefield

Publisher Resources

ISBN: 9787115560056