付録Bロジスティック回帰上のトンプソン抽出

6章では線形回帰モデルを仮定することで、パラメータ\boldsymbol{w}の事後分布を一連の計算によって求めました。ここでは、ロジスティック回帰モデルのパラメータの事後分布をベイズ推論し、バンディットアルゴリズム、特にトンプソン抽出に接続する方法を説明します。

B.1 ベイズロジスティック回帰

まずは6.4節と同様に、ベイズ推論に必要なコンポーネント、尤度関数と事前分布を整理することから始めましょう。最初に尤度関数について考えます。

ロジスティック回帰では、各解\boldsymbol{x}の報酬の期待値\theta_{\boldsymbol{x}}に下式の関係を想定するのでした。

\theta_{\boldsymbol{x}} = \mathord{\mathrm{logistic}}\left(\boldsymbol{\phi}(\boldsymbol{x})^\top\boldsymbol{w}\right)

そして、報酬はこの期待値パラメータを持つベルヌーイ分布から生成されると考えます。したがって、尤度関数は下式のように計算できます。

次に、パラメータ