
156
데이터 과학을 위한 통계
3.10
멀티암드 밴딧 알고리즘
멀티암드 밴딧
4
알고리즘은 실험설계에 대한 전통적인 통계적 접근 방식보다 명시적인 최적화
와 좀 더 빠른 의사 결정을 가능하게 하며, 여러 테스트, 특히 웹 테스트를 위해 사용된다.
용어 정리
•
멀티암드 밴딧 (
MAB
)
multi
-
armed
bandit
: 고객이 선택할 수 있는 손잡이가 여러 개인 가상의 슬롯머신을
말하며, 각 손잡이는 각기 다른 수익을 가져다준다. 다중 처리 실험에 대한 비유라고 생각할 수 있다.
•
손잡이
arm
: 실험에서 어떤 하나의 처리를 말한다 (예를 들면 ‘웹 테스트에서 헤드라인
A
’).
•
상금 (수익 )
win
: 슬롯머신으로 딴 상금에 대한 실험적 비유 (예를 들면 ‘고객들의 링크 클릭 수’)
전통적인
A
/
B
검정은 특정하게 설계된 실험을 통해 수집된 데이터를 이용하여 ‘처리
A
나 처리
B
둘 중 어느 쪽이 더 좋은가?’와 같이 정해진 질문에 대한 답을 준다. 일단 답을 얻고 나면 실
험은 멈추고 결과에 따라 행동한다.
이러한 접근에 몇 가지 어려움을 느낄 수도 있다. 첫째, 결론을 내리기 어려울 수 있다. ‘입증되
지 않은 효과’, 즉 실험 결과를 통해 효과가 있다는 것을 유추할 수는 있지만, 효과가 있더라도
그것을 입증할 만한 (전통적인 통계 표준을 만족시킬 만한 ...