1.1 機械学習の分類と強化学習 1.1.1 教師あり学習 1.1.2 教師なし学習 1.1.3 強化学習 1.2 バンディット問題 1.2.1 バンディット問題とは 1.2.2 良いスロットマシンとは 1.2.3 数式を使って表す 1.3 バンディットアルゴリズム 1.3.1 価値の推定方法 1.3.2 平均値を求める実装 1.3.3 プレイヤーの戦略 1.4 バンディットアルゴリズムの実装 1.4.1 スロットマシンの実装 1.4.2 エージェントの実装 1.4.3 動かしてみる 1.4.4 アルゴリズムの平均的な性質 1.5 非定常問題 1.5.1 非定常問題を解くために 1.5.2 非定常問題を解く 1.6 まとめ