충돌을 줄이기 위해 충분히 큰 해시 공간을 선택할 수 있습니다. 유사한 범주(예: 유사한 이름
을 가진 웹사이트)가 서로 가까운 값으로 해시되는 지역 민감 해싱
locality
-
sensitive
hashing
(
LSH
)
함수처럼 원하는 속성이 있는 해시 함수를 선택할 수도 있습니다.
하지만 이것은 정석적인 방법이 아닌 트릭이므로 학계에서는 보통 꼼수로 간주해
ML
커리큘
럼에서 제외합니다. 한편 업계에서 널리 채택됐다는 점은 이 트릭이 효과적이라는 사실을 증명
하죠.
Vowpal
Wabbit
에 채택됐으며, 사이킷런, 텐서플로 및
gensim
프레임워크에도 구현
돼 있습니다. 이는 모델이 프로덕션에서 들어오는 데이터 포인트로 학습하는 연속 학습에 특히
유용합니다. 연속 학습은
9
장에서 다룹니다.
5.2.5 5.2.5
피처 교차피처 교차
피처 교차는 둘 이상의 피처를 결합해 새로운 피처를 생성하는 기법으로, 피처 간의 비선형 관
계를 모델링하는 데 유용합니다. 예를 들어, 향후
12
개월 내 주택 구매 여부를 예측하는 작업
을 가정해봅시다. 혼인 상태와 자녀 수 사이에 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.