book

Neo4j: The Definitive Guide

Name: Neo4j: The Definitive Guide
ISBN: 9798341664869

by Luanne Misquitta, Christophe Willemsen

July 2025

Beginner to intermediate

410 pages

6h 27m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
서문
이 책을 쓴 이유이 책은 나에게 적합할까요?이 책 탐색하기이 책에서 사용된 규칙코드 예제 사용오라일리 온라인 학습문의 방법감사의 말
1. 단 5일 만에 그래프에서 가치를 얻는 방법
일렉트릭하모니의 불협화음왜 그래프 데이터베이스인가?그래프 사용 사례궁극적인 유익한 소유권 네트워크실시간 추천법 집행 기관사이버 범죄 네트워크Neo4j네이티브 그래프 데이터베이스Cypher노래 추천 시스템: 개념 증명1일차2일차3일차4일차5일차요약
2. 훨씬 더 많은 데이터 가져오기
데이터베이스 트랜잭션비트 힙 박스사용해 보기: 클라이언트 애플리케이션에서 데이터 가져오기병렬 쓰기오프라인 가져오기다른 수집 도구 살펴보기요약
3. 모델링 결정 재검토하기
상황에 따라모델링의 원리속성 대 노드결과를 장식하는 속성주요 요점공통점 가로지르기핵심 사항레이블로 개념 모델링하기핵심 사항노드 팬아웃주요 요점슈퍼노드주요 테이크어웨이관계 세분성주요 요점적격 관계버킷 관계주요 테이크어웨이양방향 관계주요 테이크어웨이요약
4. 모델링 및 리팩토링 패턴
하이퍼엣지 N-방향 관계주요 테이크어웨이시간 기반 버전 관리주요 테이크어웨이시퀀스 표현주요 요점패턴 리팩토링관계 유형 변경을 위한 리팩토링속성에서 노드를 생성하기 위한 리팩토링관계에서 노드를 생성하기 위한 리팩토링주요 요점요약
5. 쿼리 분석 및 튜닝
쿼리 실행패턴 앵커쿼리 자질 분석행 카디널리티연결되지 않은 패턴 일치시키기앵커 선택성 향상중복 필터 작업 제거술어가 있는 쿼리에서 앵커 선택성 개선하기인덱싱 가이드라인속성 액세스노드 정도조급해하지 마세요!정렬(플래너에서 벗어나고 싶어요)사이퍼 런타임쿼리 매개변수화쿼리 시간 모니터링 및 측정요약
6. 데이터베이스 보안
스푸핑인증Neo4j 브라우저를 통한 액세스 보호모범 사례변조통신 채널 보안미사용 데이터 보안일관성 검사 사용사이퍼 인젝션 공격 방어하기역할 기반 액세스 제어 구현하기CSV 로드 명령 사용감사 로그제약 조건백업거부정보 공개쿼리 로그세분화된 액세스 제어속성 암호화서비스 거부권한 상승변경 불가능한 권한최소 권한확장사용자 및 권한 검토파일 권한패치요약
7. 검색
검색이란 무엇인가요?텍스트색인데이터 검색부분 검색텍스트 인덱스전체 텍스트 인덱스다중 토큰 검색구문 검색와일드카드 검색퍼지 검색추가 인덱스 및 쿼리 고려 사항토큰화특수 문자 해시태그 및 멘션식별자, IP 주소 및 기타 비단어 용어스톱워드: 있음 또는 없음그래프 패턴을 사용한 성능요약
8. 고급 그래프 패턴
하위 쿼리호출 하위 쿼리유니온 이후 처리CALL을 사용한 동시 트랜잭션세분화된 관계 유형확인된 엔티티 모델링엔티티 그룹융합된 엔티티정량화된 경로 패턴 엔티티-솔루션 사용 사례보안 모델링: 레이블과 속성 비교요약

9. 백업 및 복원
쓰기 경로체크포인트트랜잭션 로그 보존공격적이란 얼마나 공격적인가?가이드 예시백업백업 유형백업 복원Cloud 백업원격 백업 및 VM 분리백업 전략 설계요약
10. 클러스터링 및 샤딩
고가용성을 위한 클러스터링래프트 프로토콜결함 허용 범위보조클러스터 배포클러스터 성능 저하다중 데이터베이스 클러스터네트워크 지연이 클러스터링에 미치는 영향보조 서버로 읽기 확장백업에 보조 서버 사용인과 관계 일관성신화적인 1+1 클러스터샤딩 및 페더레이션요약
11. 관찰 가능성
로그의 힘 활용하기Neo4j의 로그 유형Neo4j 로그 구성로그 검사쿼리 로그 길들이기메트릭의 힘 공개메트릭 활성화서버 로드 메트릭Neo4j 로드 메트릭Neo4j 워크로드 메트릭모든 것을 하나로 모으기: Grafana, Loki, Prometheus를 사용한 로그 및 메트릭통합 가시성 스택 설정메트릭 시각화로그 쿼리기타 도구요약
12. 실용적인 그래프 데이터 과학
그래프 데이터 과학 라이브러리 소개알고리즘그래프 카탈로그AI 기반 재생 목록 커뮤니티동시 발생 그래프 구축하기GDS 사용커뮤니티 탐지의 실제 적용 사례재생 목록 추천사용자 세분화인플루언서 발견행동 클러스터콘텐츠 라이선싱 전략요약
13. 제너레이티브 AI와 그래프의 미래
지식 그래프지식 그래프 활용고객 360사이버 보안생명 과학리테일범죄 수사GraphRAG벡터 검색은 어떤가요?에이전트 AI 아키텍처지식 그래프 생성실제 예제 자연어를 통한 재생 목록 추천1단계: GDS의 커뮤니티2단계: LLM으로 요약 및 질문 생성하기3단계: 벡터화 및 Neo4j에 저장하기4단계: 사용자가 질문하기5단계: 답변 생성6단계: 마무리요약
색인
저자 소개

Content preview from Neo4j: The Definitive Guide

2장. 훨씬 더 많은 데이터 가져오기

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

이제 여러분과 일렉트릭하모니 팀은 사용자에게 추천을 제공하기 위해 전체 사용자 기반을 더 잘 나타낼 수 있는 방대한 양의 데이터를 가져와야 하는 과제에 직면하게 되었습니다.

1장에서 데이터 수집에 사용한 방법을 시도해 보지만 트랙 데이터 세트의 크기가 10만 행에서 100만 행으로 증가함에 따라 속도가 느려지는 것으로 나타났습니다. 이것은 종종 무서운 '죽음의 쳇바퀴'로 이어져 선택한 데이터베이스가 규모에 맞게 효과적인지 궁금해집니다.

여러분의 우려는 타당합니다. 다음과 같은 팀과 이해 관계자의 주요 질문에 답해야 합니다:

비즈니스에서 데이터를 생성하는 속도만큼 빠르게 데이터를 수집할 수 있나요?
시스템이 거의 실시간으로 권장 사항을 제공하고 다른 시스템에서 생성되는 데이터를 따라잡을 수 있나요?
재해 발생 시 복구에 얼마나 오래 걸리나요?

이 장에서는 이러한 질문에 답하는 데 필요한 대규모 데이터 집합을 수집하는 방법을 보여 드립니다.

트랜잭션과 메모리 관리 등 데이터베이스 관리 시스템 내부에 대한 알기 쉬운 소개로 여정이 시작됩니다. 그런 다음, 1장에서 사용한 LOAD CSV 명령을 최적화하는 방법을 배웁니다. 그런 다음 원하는 프로그래밍 언어로 자동화된 프로그램을 사용해 데이터를 가져오는 보다 프로덕션과 유사한 시나리오로 넘어갑니다. 또한 다양한 잠금 전략을 실험하여 부정적인 영향 없이 병렬 데이터 가져오기가 가능한 시기와 방법을 파악하고 오프라인 데이터 가져오기 전략으로 마무리합니다.

데이터베이스 트랜잭션

트랜잭션은 일련의 작업을 완전히 성공하거나 완전히 실패하는 단일 단위로 그룹화하여 데이터 무결성을 보장합니다. 고유성 및 유형 제약과 같은 데이터베이스 제약 조건은 일관성과 정확성을 유지하기 위한 규칙을 적용합니다. 트랜잭션은 모든 작업이 이러한 제약 조건을 준수하도록 보장하지만, 많은 검사(예: 고유성)는 트랜잭션이 끝날 때까지(커밋 시) 연기되는 경우가 많습니다. 이렇게 하면 데이터를 한 상태에서 다른 상태로 전환하는 동안 일시적으로 제약 조건을 위반하는 등 업데이트 중에 유연하게 대처할 수 있습니다. 어떤 작업이 제약 조건을 위반하면 전체 트랜잭션이 실패하고 롤백되므로 부분적인 변경이 적용되지 않고 데이터 불일치를 방지할 수 있습니다.

1장에서 보셨듯이 이미 데이터베이스 제약 조건에 대해 어느 정도 경험해 보셨을 것입니다. 예를 들어 HAS_TRACK 관계의 position 속성이 정수가 되도록 하기 위해 제약 조건을 만들었습니다:

CREATE CONSTRAINT has_track_position_integer 
FOR ()-[r:HAS_TRACK]-() 
REQUIRE r.position IS TYPED INTEGER

다음 Cypher 쿼리와 같이 정의된 제약 조건을 준수하지 않는 데이터를 쓰려고 하면 어떻게 될까요?

 CREATE (n:Playlist)-[:HAS_TRACK ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341664869

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Neo4j: The Definitive Guide

by Luanne Misquitta, Christophe Willemsen

2장. 훨씬 더 많은 데이터 가져오기

데이터베이스 트랜잭션

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.