Skip to Content
Flink基础教程
book

Flink基础教程

by Ellen Friedman, Kostas Tzoumas
August 2018
Intermediate to advanced
98 pages
2h 11m
Chinese
Posts & Telecom Press
Content preview from Flink基础教程
对时间的处理
43
每半分钟(即
30
秒)滑动一次的一分钟滑动窗口如下所示。
stream.timeWindow(Time.minutes(1), Time.seconds(30))
4.4.2
 计数窗口
Flink
支持的另一种常见窗口叫作
计数窗口
。采用计数窗口时,分组依据不
再是时间戳,而是元素的数量。例如,图
4-6
中的滑动窗口也可以解释为由
4
个元素组成的计数窗口,并且每两个元素滑动一次。滚动和滑动的计数窗
口分别定义如下。
stream.countWindow(4)
stream.countWindow(4, 2)
虽然计数窗口有用,但是其定义不如时间窗口严谨,因此要谨慎使用。时
间不会停止,而且时间窗口总会“关闭”。但就计数窗口而言,假设其定义
的元素数量为
100
,而某个
key
对应的元素永远达不到
100
个,那么窗口就
永远不会关闭,被该窗口占用的内存也就浪费了。一种解决办法是用时间
窗口来触发超时,
4.4.4
节会详细介绍。
4.4.3
 会话窗口
Flink
支持的另一种很有用的窗口是
会话窗口
。第
3
章提到过这个概念。会
话指的是活动阶段,其前后都是非活动阶段,例如用户与网站进行一系列
交互(活动阶段)之后,关闭浏览器或者不再交互(非活动阶段)。会话需
要有自己的处理机制,因为它们通常没有固定的持续时间(有些
30
秒就结
束了,有些则长达一小时),或者没有固定的交互次数(有些可能是
3
次点
击后购买,另一些可能是
40
次点击却没有购买)。
Flink
是目前唯一
2
支持会话窗口的开源流处理器。
Flink
中,会话窗口由超时时间设定,即希望等待多久才认为会话已经结 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

机器学习流水线实战

机器学习流水线实战

Hannes Hapke, Catherine Nelson
Kafka权威指南(第2版)

Kafka权威指南(第2版)

Gwen Shapira, Todd Palino, Rajini Sivaram, Krit Petty
Java并发编程实战

Java并发编程实战

Brian Goetz, Tim Peierls

Publisher Resources

ISBN: 9787115490063