10장. 개발 시 권장 사항
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
넷플릭스 프라이즈는 2006년에 시작된 공개 머신러닝 경진대회입니다. 대회에 참가한 각 팀은 넷플릭스의 자체 콘텐츠 등급 예측 프로세스를 능가하는 알고리즘을 구축하는 것을 목표로 했습니다. 이 대회는 2009년에 우승팀에게 100만 달러의 상금을 수여했습니다.
넷플릭스 프라이즈의 한 특정 파생물은 그래프 이론 커뮤니티 전체에 파장을 일으켰고, 이 책을 읽고 있는 지금 여러분도 그 결과를 경험하고 있습니다. 이 대회는 기존 행렬 기반 알고리즘에 대한 해결책으로 그래프 사고를 사용하는 데 불을 붙였습니다.
그 결과 추천 시스템을 매트릭스로 표현하는 것보다 그래프로 설명하는 것이 훨씬 더 쉽다는 사실을 깨달았습니다. 생각해 보세요. 좋아하는 영화가 있고, 그 영화들 각각이 다른 사람들에게 높은 평가를 받았다고 가정해 보겠습니다. 그 사람들이 좋아하는 다른 영화들을 보면 여러분도 좋아할 만한 영화 목록이 있습니다. 여러분에게는 영화 추천 목록이 있습니다.
그리고 방금 그래프를 통해 이를 찾았습니다.
넷플릭스 프라이즈1 는 사용자와 영화 간의 관계를 이용해 디지털 경험을 예측하고 개인화한다는 아이디어를 대중화했습니다. 데이터를 그래프처럼 생각한다는 이 작은 아이디어는 그래프적 사고의 부상을 이끈 주요 동인 중 하나가 되었습니다.
이 장과 12장을 통해 이 아이디어를 구체화하겠습니다. 궁금하신 분들을 위해 11장에서는 이 장에서 보여드릴 그래프 모델을 어떻게 만들었는지 설명합니다.
챕터 미리보기: 영화 추천을 위한 협업 필터링
이 장에서는 사이트/앱이 사용자에게 영화를 추천하는 방법을 살펴보면서 협업 필터링을 정의하고 보여드리겠습니다.
첫 번째 섹션에서는 추천 시스템의 세 가지 예시를 살펴보겠습니다. 이 세 가지 예는 애플리케이션에서 사용자 경험을 맞춤화하는 데 그래프 사고가 얼마나 깊이 뿌리내리고 있는지를 보여줍니다. 아마도 여러분도 모르는 사이에 이러한 기법을 매일 사용하고 있을 것입니다.
두 번째 섹션에서는 협업 필터링에 대해 소개합니다. 추천에 그래프 구조를 사용하는 가장 보편적인 방법인 항목 기반 협업 필터링에 초점을 맞출 것입니다.
세 번째 섹션에서는 영화 추천 예제를 위한 오픈 소스 데이터 세트 두 개를 소개합니다. 복잡한 스키마를 구축하고 데이터 구조와 로드 절차를 보여드리겠습니다. 다음 두 장에서 이 데이터를 사용하게 될 것입니다.
그런 다음, 영화 데이터 집합에 대한 복잡한 데이터 모델을 사용하여 이 책의 주요 기법을 간단히 살펴봅니다. 그래프 데이터로 가장 많이 사용되는 세 가지 제작 쿼리인 이웃, 나무, 경로를 수정하여 병합된 데이터 집합을 살펴보겠습니다.
이 장의 마지막 섹션에서는 그렘린에서 항목 기반 협업 필터링을 수행하는 방법을 단계별로 설명합니다. 트리와 경로 장에서 살펴보았듯이 이 장의 마지막에는 실시간으로 협업 필터링을 수행할 때의 확장성 때문에 문제가 ...