른 상위 결과 중 일부가 너무 근접하다는 것은 데이터셋이 너무 작아서 일반적인 관계를 학습
하기에는 지나치게 특화될 수 있다는 신호다.
마지막으로 [그림
11
-
1
]에 표시된 히스토그램을 살펴보자.
그림
11-1
50
에폭에서 단어 간 유사성 히스토그램
302
2
부
빌딩 블록
대부분의 유사점은 높은 쪽에 있다. 이것은
50
에폭에서 단어들이 매우 유사하다는 의미다.
이번에는 다음 [그림
11
-
2
]에 표시된 것처럼
100
에폭의 히스토그램을 살펴보자.
그림
11-2
100
에폭에서 단어 간 유사성 히스토그램
히스토그램의 가중치가 중간으로 이동했다. 단어 사이에 더 많은 차이가 있다는 의미다.
이제 [그림
11
-
3
]과 같이
500
에폭을 살펴보자. 히스토그램의 질량이 왼쪽으로 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.