Skip to Content
Flink基础教程
book

Flink基础教程

by Ellen Friedman, Kostas Tzoumas
August 2018
Intermediate to advanced
98 pages
2h 11m
Chinese
Posts & Telecom Press
Content preview from Flink基础教程
有状态的计算
67
增长的情况(如
tweet
)。
2016
2
月,
data Artisans
的博客发表了一篇文
3
,对
Yahoo! Streaming Benchmark
进行了拓展,并专注于解决上述问题。
由于最初的测试结果显示
Spark Streaming
的性能欠佳,因此这次的测试对
象只有
Storm
Flink
,它们在最初的测试中有着类似的表现。
1
个变化是利用
Flink
提供的状态容错特性重新实现应用程序,如图
5-15
所示。这使得应用程序能保证
exactly-once
数据
生成
输入
解析/
过滤/
转换
按照id
分组
窗口/聚合 查询
5-15:重新实现的应用程序利用了 Flink 内置的状态机制,并且可以保持每秒
300 万事件的吞吐量,同时保证 exactly-once。此时,应用程序的瓶颈在于 Flink
群与 Kafka 集群的连接(图中以粗箭头表示)
5.5.3
 变化
2
改进数据生成器并增加吞吐量
2
个变化是通过用每秒可以生成数百万事件的数据生成器来增加输入流
的数据量。结果如图
5-16
所示。
3
https://data-artisans.com/blog/extending-the-yahoo-streaming-benchmark
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

机器学习流水线实战

机器学习流水线实战

Hannes Hapke, Catherine Nelson
Kafka权威指南(第2版)

Kafka权威指南(第2版)

Gwen Shapira, Todd Palino, Rajini Sivaram, Krit Petty
Java并发编程实战

Java并发编程实战

Brian Goetz, Tim Peierls

Publisher Resources

ISBN: 9787115490063