Skip to Content
머신러닝 시스템 설계
book

머신러닝 시스템 설계

by 칩 후옌, 김대근, 김영민
March 2023
Beginner to intermediate
436 pages
9h 20m
Korean
Hanbit Media, Inc.
Content preview from 머신러닝 시스템 설계
262
머신러닝 시스템 설계
DistilBERT
로 대체하고(
2
번 시나리오) 고정 형상 입력값을 동적 길이 입력값
dynamic
shape
input
으로 대체하고(
3
번 시나리오) 마지막에는 양자화를 수행했습니다(
4
번 시나리오).
시나리오
1
:
베이스라인
BERT
(파이토치
BERT
+ 고정 길이 입력)
시나리오
2
: 더 작은 모델
(파이토치
DistilBERT
+ 고정 길이 입력)
시나리오
3
: 더 작은 입력
(파이토치
DistilBERT
+ 동적 길이 입력)
시나리오
4
:
더 작은 가중치
(파이토치
DistilBERT
+ 동적 길이 입력
+ 양자화)
BERT
스케일링: 주요 개선 사항
32
개 코어를 활용한 스루풋(초당 추론 횟수)
레이턴시(중앙값). 단위: 밀리초
그림
7-10
다양한 모델 압축 방식으로 레이턴시 개선하기(출처: 레 등이 작성한 논문의 이미지를 각색함)
성능은 양자화에서 가장 크게 향상됐습니다.
32
비트 부동 소수점 수를
8
비트 정수로 변환하면
레이턴시가
7
배 감소하고 스루풋이
8
배 증가합니다.
이러한 기법들은 레이턴시를 개선할 가능성이 매우 높습니다. 다만 각 시나리오에서 성능 향상
후 결괏값의 품질 변화에 대한 언급이 없다는 점을 감안하기 바랍니다.
7.4
클라우드와 에지에서의 머신러닝 클라우드와 에지에서의 머신러닝
모델 계산을 클라우드와 에지 중 어디에서 수행할지도 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

마이크로서비스 아키텍처 구축(전면 개정판)

마이크로서비스 아키텍처 구축(전면 개정판)

샘 뉴먼
파이썬으로 살펴보는 아키텍처 패턴

파이썬으로 살펴보는 아키텍처 패턴

오현석, 해리 퍼시벌, 밥 그레고리
러닝 타입스크립트

러닝 타입스크립트

조시 골드버그
GPT-4를 활용한 인공지능 앱 개발

GPT-4를 활용한 인공지능 앱 개발

올리비에 케일린, 마리 알리스 블레트

Publisher Resources

ISBN: 9791169210850