1.8 本章のまとめ

本章では、A/Bテストというシンプルな題材を通してベイズ推論による仮説検定の方法を概観しました。まずA/Bテストというシンプルな実験のフレームワークによって、ユーザの行動に大きな影響を与えることができることを説明しました。そしてA/Bテストにおいてデータが生成される過程を、統計モデルのかたちで整理しました。

よく知られている確率分布をパーツとして統計モデルを構成できれば、私たちが解きたい問題はそれらのパラメータを求める問題に還元されます。そこで力を発揮するのがベイズ推論です。ベイズ推論では、観測されたデータとベイズの定理によって、私たちがパラメータに対して持つ信念(これも確率分布で表されるのでした)を更新します。そして、パラメータ自体もある確率分布に従う確率変数なので、そのサンプルを大量に生成して大数の法則を適用し、その背後にある確率分布を推論することで、私たちの仮説を検証するための材料を得られます。

ここでは、クリックの有無を対象にしたベイズ推論の枠組みを紹介しましたが、同様に結果が0または1で表されるもの(たとえば契約の有無など)ならば、そのままこのアプローチを適用できます。また、滞在時間(非負の連続値)や購入数(0以上の整数)に対しても、統計モデルを構成する確率分布を適切なものに入れ替えるだけで、同様のアプローチが適用できます。適切な確率分布を導入して統計モデルを記述し、ベイズの定理を用いて事後分布を計算し、得られた事後分布から生成されたサンプルに対して考察を加えて検定するという作業の流れは変わりません。この章で学んだことだけでも、いろいろなことができそうな気がしてきたのではないでしょうか?

ただし、今回の事後分布を得るまでにいくつかの計算を駆使してきたことも事実です。今回はベルヌーイ過程というシンプルな(だが奥深い)現象に対してさまざまな考察と計算を加えることで、最終的にベータ分布というきれいな形で事後確率を記述できました。しかし、あらゆる統計モデルで事後分布がこのようなきれいな形で記述できるとは限りません。次の章ではより柔軟な統計モデリングをするために、より計算 ...