
148
머신러닝 인터뷰 실무 가이드
러한 상황은 일반적으로 ‘콜드 스타트’ 문제라고 불리는데, 아직 어떤 제품도 구매하거나 평
가하지 않은 사용자들로 인해 발생합니다.
콘텐츠 기반 추천 시스템은 다른 사용자들의 선호도나 평가에 의존하지 않기 때문에 사용자
행동 데이터가 덜 필요하며 사용자 피드백이 전반적으로 적은 신규 사용자나 틈새 항목에 특
히 적합합니다. 그러나 콘텐츠 기반 시스템은 사용자가 이전에 상호작용한 항목과 유사한 항
목을 추천하는 데에만 국한될 수 있습니다. 이로 인해, 새로운 항목이 사용자에게 소개되지
않아, 사용자가 추천받았다면 좋아했을 제품이나 항목의 다양성이 제한됩니다.
TIP
사용자 기반, 항목 기반, 그리고 콘텐츠 기반 추천 시스템 간의 트레이드오프를 이해하는 것은 인터뷰는
물론 실제 업무에서도 유용합니다. 현실에서는 명시적 피드백은 얻기 어렵고 암시적 피드백은 완벽하지 않을
수 있습니다. 사용 가능한 모든 데이터와 추천 시스템 알고리즘을 결합하고 조정하는 방법을 아는 후보자는
눈에 띌 것입니다.
행렬 분해 요약
행렬 분해
Matrix
factorization
는 협업 필터링에서 사용되는 기법입니다. 사용자를 행으로, 항목을
열로 하는 행렬을 만들어 사용자의 항목에 대한 평가나 선호도를 셀에 표현합니다. 이 행렬
을 사용자-항목 행렬이라고 ...