보시다시피, 카운트다운과 이야기 생성이 동시에 실행됐고, 스트리밍 옵션을 통해 모델의 출력
을 생성되는 대로 출력되는 걸 확인할 수 있었습니다.
다른 설계 전략들
애플리케이션에 지연 시간을 줄이는 전략을 추가할 수도 있습니다.
●
자주 사용하는 쿼리를 캐싱
caching
하세요.
●
짧은 프롬프트를 사용하고 불필요한 단어를 피함으로써 입력 길이를 제한하세요.
●
프롬프트에 길이 제한을 추가하고
max_tokens
매개변수를 사용해서 출력 길이를 제한하세요.
●
애플리케이션 사용자들을 대상으로 자체적인 요청 제한을 구현해 모든 사용자가 공평하게 사용할 수 있
도록 하세요.
●
프롬프트 압축을 사용해 추론 속도를 높일 수 있습니다(
3
.
5
절).
지금까지 살펴본 바와 같이, 외부
API
를 통해 애플리케이션에
LLM
을 통합하면 여러 장애물이
나타납니다. 이는 다양한 전략을 통해 해결할 수 있습니다. 오픈
AI
는 생산 모범 사례에 관한
자세한 가이드(
https
://
oreil
.
ly
/
PXsDG
)를 제공합니다. 마이크로소프트의 논문 <인간과
AI
의 상호작용을 위한 가이드라인>
22
도 훌륭한 사례가 될 수 있습니다.
3.8
정리
이 장에서는 오픈
AI
API
를 사용한 애플리케이션 개발의 흥미로운 가능성을 살펴봤습니다.
API
키 관리, 데이터 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.