
164
GPT API를 활용한 인공지능 앱 개발(2판)
이 한도는 독립적으로 산정되므로 분당 요청 혹은 토큰 제한 중 하나만 초과해도, 이후 요청은
계속 실패하며
openai
.
error
.
RateLimit
Error
가 발생합니다.
요청 제한에 도달하지 않도록 다음 접근 방식을 시도할 수 있습니다.
●
3
.
5
절에서 소개한 전략으로 프롬프트를 검토하고 토큰 수를 줄입니다.
●
요청 수를 제한하거나 여러 요청을 하나의 프롬프트로 그룹화할 수 있습니다.
●
앞의 절에서 설명한 지수 백오프를 사용해 재시도 기능을 구현합니다.
예상치 못한 일을 방지하기 위해
API
사용량 모니터링은 필수입니다. 애플리케이션이 새로운
사용자를 끌어모으면 요청 수가 증가할 것이므로 속도 제한 문제를 예측할 수 있습니다.
3.7.3
응답성과 사용자 경험 향상
오픈
AI
모델의 응답 시간은 오픈
AI
의 서버 상황, 선택한 모델, 입출력에 포함된 토큰 수에 영
향을 받습니다.
GPT
-
4
의 응답 속도는
GPT
-
3
.
5
의 응답 속도보다 느렸습니다. 이후 출시된
GPT
-
4o
의 응답 속도는
GPT
-
4
의 응답 속도보다 두 배 빨라졌습니다. 애플리케이션이 외부
API
를 사용한다면
API
의 응답 속도는 애플리케이션의 응답성과 사용자 경험에 부정적인 영향
을 줍니다. 이에 대비할 수 있도록 오픈
AI
의
API
는 스트리밍과 ...