
316
AI
를 위한 필수 수학
것이 바로 이 모델의 결과가 현실에 매우 가깝게 보이는 이유다.
자연어 처리에 중점을 둔 <
Chapter
7
자연어 처리와 금융 인공지능>에서는 생성 모델을 명시
적으로 언급하지 않았다. 단순한 분류 모델 (스팸 분류, 감성 분석, 품사 태깅 )이 아닌 대부분
의 자연어 처리 애플리케이션에는 언어 생성이 포함된다. 예를 들어 텍스트 자동 완성, 기계 번
역, 텍스트 요약, 챗봇, 이미지 캡셔닝 등이 있다.
8.2
생성 모델의 일반적인 수학
생성 모델은 확률 분포를 통해 세상을 인식하고 표현한다. 즉, 컬러 이미지는 의미 있는 이미지
를 구성하는 픽셀의 결합 확률 분포에서 나온 하나의 샘플이고 (빨간색, 초록색, 파란색 채널을
모두 포함하는 이런 결합 확률 분포의 차원을 계산해보자 ), 오디오 파형은 의미 있는 소리를
구성하는 오디오 신호의 결합 확률 분포에서 나온 하나의 샘플이며 (오디오 신호의 결합 확률
분포 역시 매우 고차원이다 ), 문장은 일관된 문장을 나타내는 단어나 문자의 결합 확률 분포에
서 나온 하나의 샘플이다.
그렇다면 자연스럽게 따라오는 질문이 있다. 세상의 복잡성을 잡아낼 수 있는 대표적인 결합
확률 분포는 어떻게 계산할 수 있을까? 안타깝게도 이런 결합 확률 분포는 극도로 고차원적이다.
이 지점에서 머신러닝의 답변을 ...