문제를 세분화한 각 하위 작업은 서로 다른 수준의 모델 역량을 요구할 수 있습니다. 비용과 지연 시간을 최
소화하려면 각 작업에 필요한 성능 기준을 충족하는 가장 작은 규모의
LLM
을 사용하는 것이 바람직합니다.
모든
LLM
이 동일한 작업을 수행하는 경우
모든
LLM
이 동일한 작업을 처리하지만, 입력마다 하나(또는 일부)
LLM
만 선택되어 실행됩니다.
TIP
하나의 작업을 여러
LLM
앙상블이 함께 처리하고, 최종 결과는 다수결 투표나 보간과 같은 규칙에 따라 선택
할 수 있습니다. 장 연구진
1
이 제안한
LLM
-
Blender
는 이러한 앙상블 전략을 잘 보여주는 사례입니다.
연습 문제 ●●●
이 책의 깃허브 저장소
2
에서 법률 에이전트의 기본 구현을 찾을 수 있습니다. 이 에이전트는 웹
에서 정보를 검색하고 법정 사건에 관한 사용자 질문에 답변하도록 설계되었습니다. 또한 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.