book

Kafka Connect

Name: Kafka Connect
ISBN: 9798341654662

by Mickael Maison, Kate Stanley

May 2025

Beginner to intermediate

402 pages

6h 33m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

머리말
서문
이 책을 읽어야 하는 대상Kafka 버전이 책 탐색하기이 책에서 사용된 규칙오라일리 온라인 학습문의 방법감사
I. Kafka Connect 소개
1. Kafka Connect 만나보기
Kafka Connect 기능플러그형 아키텍처확장성 및 안정성선언적 파이프라인 정의Apache의 일부 Kafka사용 사례데이터베이스 변경 사항 캡처Kafka 클러스터 미러링하기데이터 레이크 구축로그 집계레거시 시스템 현대화Kafka Connect의 대안요약
2. Apache Kafka 기초
분산 이벤트 스트리밍 플랫폼오픈 소스분산이벤트 스트리밍플랫폼Kafka 개념게시-구독브로커 및 기록주제 및 파티션복제유지 및 압축KRaft와 ZooKeeperKafka와 상호 작용하기프로듀서소비자Kafka 스트림Kafka 시작하기Kafka 시작하기기록 보내기 및 받기Kafka 스트림 애플리케이션 실행하기요약
II. Kafka Connect로 데이터 파이프라인 개발하기
3. Kafka Connect 데이터 파이프라인의 구성 요소
Kafka Connect 런타임Kafka Connect 실행하기Kafka Connect REST API플러그인 설치배포 모드소스 및 싱크 커넥터커넥터 및 작업커넥터 구성실행 중인 커넥터변환기데이터 형식 및 스키마변환기 구성변환기 사용변환 및 술어변환 사용 사례술어변환 및 술어 구성하기변환 및 술어 사용요약
4. 효과적인 데이터 파이프라인 설계
커넥터 선택파이프라인 방향라이선스 및 지원커넥터 기능데이터 모델 정의데이터 혁신시스템 간 데이터 매핑데이터 서식 지정데이터 형식스키마Kafka Connect 내부 살펴보기내부 주제그룹 멤버십프로토콜 재조정Kafka Connect에서 장애 처리하기작업자 실패커넥터/작업 실패Kafka/외부 시스템 장애죽은 편지 대기열처리 의미론 이해싱크 커넥터소스 커넥터요약
5. 작동 중인 커넥터
Confluent S3 싱크 커넥터커넥터 구성정확히 한 번 의미론커넥터 실행Confluent JDBC 소스 커넥터커넥터 구성커넥터 실행Debezium MySQL 소스 커넥터커넥터 구성이벤트 형식커넥터 실행요약
6. 미러메이커를 사용한 클러스터 미러링
미러링 소개미러링 사용 사례 살펴보기실제로 미러링하기미러메이커 소개공통 개념배포 모드미러메이커 커넥터미러소스 커넥터미러체크포인트 커넥터미러 하트비트 커넥터미러메이커 실행재해 복구 예시지리적 복제 예시요약

III. 프로덕션 환경에서 Kafka Connect 실행하기
7. Kafka Connect 클러스터 배포 및 운영하기
Kafka Connect 환경 준비하기Kafka Connect 환경 구축하기플러그인 설치네트워킹 및 권한워커 플러그인구성 공급자REST 확장 프로그램커넥터 클라이언트 구성 재정의 정책용량 크기 조정 및 계획Kafka Connect 리소스 활용에 대한 이해작업자 및 작업 수는 몇 명인가요?Kafka Connect 클러스터 운영하기작업자 추가작업자 제거작업자에 대한 유지 관리 업그레이드 및 적용실패한 작업 및 커넥터 다시 시작하기커넥터 오프셋 재설정REST API를 사용하여 Kafka Connect 관리하기커넥터 생성 및 삭제커넥터 및 작업 구성커넥터의 수명 주기 제어커넥터 오프셋 나열문제 디버깅요약
8. Kafka Connect 구성하기
런타임 구성프로덕션용 구성미세 조정 구성커넥터 구성주제 구성클라이언트 재정의정확히 한 번 구성하기오류 처리를 위한 구성보안을 위한 Kafka Connect 클러스터 구성하기Kafka에 대한 연결 보안 유지권한 구성REST API 보안요약
9. Kafka Connect 모니터링하기
모니터링 로그로깅 구성시작 로그 이해로그 분석모니터링 지표메트릭 리포터메트릭 분석메트릭 살펴보기주요 지표Kafka Connect 런타임 메트릭기타 시스템 메트릭요약
10. Kubernetes에서 Kafka Connect 관리하기
Kubernetes 소개가상화 기술Kubernetes 기본 사항Kubernetes에서 Kafka Connect 실행하기컨테이너 이미지워커 배포네트워킹 및 모니터링구성Kubernetes 오퍼레이터를 사용하여 Kafka Connect 배포하기Kubernetes 오퍼레이터 소개Kafka Connect용 Kubernetes 연산자스트림지Kubernetes 환경 가져오기운영자 시작하기Kafka Connect CRDKafka Connect 클러스터 및 커넥터 배포하기미러메이커 CRD요약
IV. 사용자 지정 커넥터 및 플러그인 구축
11. 빌딩 소스 및 싱크 커넥터
공통 개념 및 API사용자 지정 커넥터 구축커넥터 API구성작업 APIKafka 연결 기록커넥터 컨텍스트 API소스 커넥터 구현하기소스태스크 API소스 레코드소스 커넥터 컨텍스트 및 소스 태스크 컨텍스트 API정확한 1회 지원싱크 커넥터 구현싱크태스크 API싱크 기록싱크커넥터 컨텍스트 및 싱크태스크 컨텍스트 API요약
12. 커넥터 및 워커 플러그인으로 Kafka Connect 확장하기
커넥터 플러그인 구현하기변환 API술어 API변환기 및 헤더 변환기 API워커 플러그인 구현하기컨피그프로바이더 API커넥터 클라이언트 컨피그 오버라이드 정책 APIConnectRestExtension API요약
색인
저자 소개

Content preview from Kafka Connect

4장. 효과적인 데이터 파이프라인 설계

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

이 장에서는 Kafka Connect를 사용해 탄력적이고 효과적인 데이터 파이프라인을 구축하는 방법을 알아봅니다. 3장에서 소개한 구성 요소를 조립할 때 데이터 엔지니어와 아키텍트가 이해해야 하는 핵심 개념과 의사 결정 포인트에 대해 설명합니다.

이 장의 전반부에서는 파이프라인을 위한 커넥터 플러그인을 선택하는 방법을 살펴봅니다. 커넥터, 변환기, 그리고 선택적으로 몇 가지 변환 및 술어가 필요합니다. 커넥터를 평가하고 커뮤니티에서 사용할 수 있는 수백 개의 커넥터 중에서 프로덕션 요구 사항을 충족하는 커넥터를 식별하는 방법에 대해 설명합니다. 그런 다음 데이터가 파이프라인을 통과할 때 데이터를 모델링하는 방법과 사용 가능한 서식 지정 옵션에 대해 설명합니다.

이 장의 후반부에서는 Kafka Connect의 복원력 특성에 대해 중점적으로 설명합니다. 파이프라인을 구축하기 전에 사용 사례에 따라 필요한 시맨틱을 식별해야 합니다. 예를 들어, 모든 데이터가 전송되도록 보장해야 하는가, 아니면 처리량 증가를 위해 일부 데이터 손실을 감수해도 괜찮은가? 먼저 장애를 처리할 수 있는 견고한 환경인 Kafka Connect의 내부 작동 방식을 자세히 살펴봅니다. 그런 다음 싱크 및 소스 파이프라인이 달성할 수 있는 의미와 특정 사용 사례를 대상으로 사용할 수 있는 다양한 구성 옵션 및 절충안을 살펴봅니다.

커넥터 선택

Kafka Connect를 사용하는 데이터 파이프라인을 구축할 때는 먼저 어떤 커넥터를 설치할지 결정해야 합니다. Kafka는 매우 인기 있는 기술이기 때문에 선택할 수 있는 기존 커넥터가 많이 있습니다. 새로 만드는 것보다 기존 커넥터를 사용하는 것이 더 나은 경우가 많지만, 요구 사항을 충족하는 경우에만 가능합니다. 다음은 특정 커넥터를 파이프라인의 일부로 사용할지 여부를 선택할 때 고려해야 할 몇 가지 사항입니다:

파이프라인 방향(소스 또는 싱크)
라이선스 및 지원
커넥터 기능

파이프라인 방향

먼저 커넥터가 올바른 방향으로 데이터를 흐르고 있는지 확인합니다. Kafka로 데이터를 생성하는 소스 커넥터인가요, 아니면 Kafka에서 소비하는 싱크 커넥터인가요? 대부분의 커넥터는 이름에 이 세부 정보가 포함되어 있으며 일반적으로 설명서를 통해 명확하게 알 수 있습니다. 그렇지 않은 경우, Kafka Connect 환경에 커넥터를 설치하고 REST API를 사용하여 유형을 검색할 수 있습니다.

$ curl localhost:8083/connector-plugins
[
  {
    "class": "org.apache.kafka.connect.mirror.MirrorCheckpointConnector",
    "type": "source",
    "version": "3.5.0"
  },
  {
    "class": "org.apache.kafka.connect.mirror.MirrorHeartbeatConnector" ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341654662

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design