Skip to Content
머신러닝 시스템 설계
book

머신러닝 시스템 설계

by 칩 후옌, 김대근, 김영민
March 2023
Beginner to intermediate
436 pages
9h 20m
Korean
Hanbit Media, Inc.
Content preview from 머신러닝 시스템 설계
178
머신러닝 시스템 설계
해시 크기(
n
)
충돌 비율(%)
로그 손실
로그 손실
해시 크기(
n
)
그림
5-4
50
% 해시 충돌 비율은 로그 손실을 단지
0
.
5
% 미만으로 증가시킵니다(출처: 루카스 베르나르디).
충돌을 줄이기 위해 충분히 큰 해시 공간을 선택할 수 있습니다. 유사한 범주(예: 유사한 이름
을 가진 웹사이트)가 서로 가까운 값으로 해시되는 지역 민감 해싱
locality
-
sensitive
hashing
(
LSH
)
함수처럼 원하는 속성이 있는 해시 함수를 선택할 수도 있습니다.
하지만 이것은 정석적인 방법이 아닌 트릭이므로 학계에서는 보통 꼼수로 간주해
ML
커리큘
럼에서 제외합니다. 한편 업계에서 널리 채택됐다는 점은 이 트릭이 효과적이라는 사실을 증명
하죠.
Vowpal
Wabbit
에 채택됐으며, 사이킷런, 텐서플로 및
gensim
프레임워크에도 구현
돼 있습니다. 이는 모델이 프로덕션에서 들어오는 데이터 포인트로 학습하는 연속 학습 특히
유용합니다. 연속 학습은
9
장에서 다룹니다.
5.2.5 5.2.5
피처 교차피처 교차
피처 교차는 둘 이상의 피처를 결합해 새로운 피처를 생성하는 기법으로, 피처 간의 비선형 관
계를 모델링하는 데 유용합니다. 예를 들어, 향후
12
개월 내 주택 구매 여부를 예측하는 작업
을 가정해봅시다. 혼인 상태와 자녀 수 사이에 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

마이크로서비스 아키텍처 구축(전면 개정판)

마이크로서비스 아키텍처 구축(전면 개정판)

샘 뉴먼
파이썬으로 살펴보는 아키텍처 패턴

파이썬으로 살펴보는 아키텍처 패턴

오현석, 해리 퍼시벌, 밥 그레고리
러닝 타입스크립트

러닝 타입스크립트

조시 골드버그
GPT-4를 활용한 인공지능 앱 개발

GPT-4를 활용한 인공지능 앱 개발

올리비에 케일린, 마리 알리스 블레트

Publisher Resources

ISBN: 9791169210850