book

Kafka Connect

Name: Kafka Connect
ISBN: 9798341658189

by Mickael Maison, Kate Stanley

May 2025

Intermediate to advanced

402 pages

5h 9m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
序言
谁应该阅读这本书Kafka 版本本书导航本书使用的约定O'Reilly 在线学习如何联系我们致谢
I.Kafka Connect 简介
1.认识 Kafka Connect
Kafka 连接功能可插拔架构可扩展性和可靠性声明式管道定义Apache Kafka 的一部分使用案例捕捉数据库更改Kafka 集群镜像构建数据湖汇总日志传统系统现代化Kafka Connect 的替代方案摘要
2.Apache Kafka 基础知识
分布式事件流平台开放源代码已分发活动流平台Kafka 概念发布-订阅经纪人和记录主题和分区复制滞留和压实KRaft 和 ZooKeeper与 Kafka 互动生产商消费者Kafka 流Kafka 入门启动 Kafka收发记录运行 Kafka Streams 应用程序摘要
II.使用 Kafka Connect 开发数据管道
3.Kafka Connect 数据管道中的组件
Kafka 连接运行时运行 Kafka ConnectKafka Connect REST API安装插件部署模式源和汇接器连接器和任务配置连接器运行连接器转换器数据格式和模式配置转换器使用转换器转换和谓词转型用例谓词配置转换和谓词使用转换和谓词摘要
4.设计有效的数据管道
选择连接器管道方向许可和支持连接器功能定义数据模型数据转换系统间数据映射格式化数据数据格式模式探索 Kafka Connect 内部结构内部主题团体会员再平衡规程处理 Kafka Connect 中的故障工人失败连接器/任务故障Kafka/ 外部系统故障死信队列了解处理语义水槽连接器源连接器摘要
5.行动中的连接器
Confluent S3 Sink 连接器配置连接器一次完全语义学运行连接器Confluent JDBC 源连接器配置连接器运行连接器Debezium MySQL 源连接器配置连接器活动格式运行连接器摘要
6.使用 MirrorMaker 镜像集群
镜像简介探索镜像使用案例镜像实践MirrorMaker 简介共同概念部署模式MirrorMaker 连接器镜像源连接器镜像检查点连接器镜像心跳连接器运行 MirrorMaker灾难恢复示例地理复制示例摘要

III.在生产中运行 Kafka Connect
7.部署和运行 Kafka Connect 集群
准备 Kafka Connect 环境构建 Kafka Connect 环境安装插件Network+ 和权限工人插件配置提供商REST 扩展连接器客户端配置覆盖策略容量大小和规划了解 Kafka Connect 资源利用率有多少工人和任务？操作 Kafka Connect 集群增加工人撤走工人工人的升级和应用维护重启失败的任务和连接器重置连接器偏置使用 REST API 管理 Kafka Connect创建和删除连接器连接器和任务配置控制连接器的生命周期列表连接器偏移调试问题摘要
8.配置 Kafka Connect
配置运行时生产配置微调配置配置连接器主题配置客户端重载精确一次的配置错误处理配置为安全配置 Kafka 连接集群确保与 Kafka 的连接安全配置权限确保 REST API 的安全摘要
9.监控 Kafka Connect
监控日志日志配置了解启动日志分析日志监测指标指标报告员分析指标探索衡量标准关键指标Kafka Connect 运行时指标其他系统指标摘要
10.在 Kubernetes 上管理 Kafka Connect
Kubernetes 简介虚拟化技术Kubernetes 基础知识在 Kubernetes 上运行 Kafka Connect集装箱图像部署工人联网和监控配置使用 Kubernetes 操作员部署 Kafka ConnectKubernetes 操作员介绍Kafka Connect 的 Kubernetes 操作员Strimzi获取 Kubernetes 环境启动操作员Kafka 连接 CRD部署 Kafka Connect 集群和连接器镜像制造 CRD摘要
IV.构建自定义连接器和插件
11.构建源和汇连接器
通用概念和应用程序接口创建自定义连接器连接器应用程序接口配置任务 APIKafka 连接记录ConnectorContext API实施源连接器源任务 API来源记录SourceConnectorContext 和 SourceTaskContext API一次支持实施水槽连接器SinkTask API水槽记录SinkConnectorContext 和 SinkTaskContext API摘要
12.使用连接器和 Worker 插件扩展 Kafka Connect
实施连接器插件转型应用程序接口谓词应用程序接口转换器和页眉转换器应用程序接口实施工人插件配置提供程序接口ConnectorClientConfigOverridePolicy APIConnectRestExtension API摘要
索引
关于作者

Content preview from Kafka Connect

第 7 章. 部署和运行Kafka Connect 集群

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在本章中，我们将重点介绍如何部署和操作 Kafka Connect 群集。从部署开始，我们将探讨如何构建 Kafka Connect 环境，使用连接器和 Worker 插件对其进行自定义，并确定网络和权限要求。我们还将讨论如何有效地调整集群规模，以处理使用案例的工作量。然后，进入操作阶段，我们将介绍管理员在运行中的 Kafka Connect 集群上执行的最常见操作，例如添加和删除 Worker、应用升级、重启失败的任务和重置偏移量。最后，我们将概述 Kafka Connect REST API，并解释如何使用每个可用端点来管理和监控集群。

读完本章后，你将能够部署和维护一个生产型 Kafka Connect 集群。

准备 Kafka Connect 环境

在第 3 章中，我们谈到了部署 Kafka Connect 时独立模式和分布式模式的区别。分布式模式有更多的操作步骤，但由于它提供了额外的弹性，因此推荐用于生产部署。在本章中，我们假设你在分布式模式下部署 Kafka Connect。

备注

如果您选择使用独立模式，请在阅读本章时牢记以下几点：

在独立模式下，，只能部署单个独立的工作员，并且不能随着新工作员的加入而自动扩展。
在单机模式下，工作者将状态存储在文件系统中。在考虑大小和容量规划时，请记住这一点。

在决定如何配置 Kafka Connect 集群之前，必须先选择部署它的环境。与 Kafka 一样，Kafka Connect 也是一个基于 Java 的项目。这，意味着只要你有Kafka Connect库，就可以在任何Java环境下运行它。请确保使用Kafka 网站上推荐的 Java 版本。

Kafka Connect Worker 和 Kafka Brokers 可以运行在同一个物理节点上，也可以分开运行。将它们分开可以提供更强的故障恢复能力，但在较小的环境中，将它们放在一起很常见。无论如何放置，Kafka Connect Worker 的部署、配置和升级都应独立于相关 Kafka 集群中的 Broker。虽然 Worker 和 Broker 需要类似的环境，但它们的生命周期不同，需要独立扩展。

部署 Kafka Connect 的最常见方式是将其部署在与其交互的 Kafka 集群相同的基础架构上。这样做可以在两个方面带来好处：操作流程和网络流量。Kafka 和 Kafka Connect 的操作流程类似。它们都需要 Java 环境，都是分布式工作负载，可以类似的方式进行扩展和监控。这意味着，无论你是将它们部署在裸机上，还是部署在 Kubernetes 这样的平台上，都更容易对两者使用相同的基础架构，而不必为多个环境采用或创建工具。Kafka Connect 使用 Kafka 来存储状态并在 Worker 之间进行协调。如果集群之间距离较近，这种流量的延迟会更低。

在某些情况下，最好与外部系统一起运行 Kafka Connect，而不是与 Kafka 集群一起运行。这取决于外部系统和连接器。例如，消息队列系统 IBM MQ 包括两种连接选项：绑定模式和客户端模式。IBM MQ 连接器支持这两种模式，但对于只允许绑定连接的 MQ 安装，Kafka Connect 集群和连接器必须与 IBM MQ 系统在同一环境中运行，连接才能成功。

让我们来看看为 Kafka ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341658189

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Kafka Connect

by Mickael Maison, Kate Stanley

第 7 章. 部署和运行Kafka Connect 集群

准备 Kafka Connect 环境

备注

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.