
104 4 章 スコアとランキング
ンス
の授業でスーパーボールの結果を予想する課題を出すまで、Clyde のことをすっかり忘れていた。私の
授業でこの課題を出されたチームは、インド出身の学生で構成されており、プロジェクトの開始時点では、
アメリカンフットボールよりもクリケットの方がずっと詳しいという学生たちだった。
それでも彼らは課題に取り組み、過去 10 年間のすべてのプロと大学の試合結果から大規模なデータセッ
トを構築し、フットボールのファンにもなった。彼らは、ラッシング、パッシング、キッキングの獲得ヤー
ド数、タイム・オブ・ポゼッション、パント数などを含む 142 種類の特徴に対してロジスティック回帰分
析を行った。そして、私のもとに誇らしげに自分たちのモデルの正確度を報告に来た。NFL の試合結果の
51.52 % を正しく予想できたというのである。
思わず大声が出た。「何だって? それは大変だ! 50 % はコイン投げでも得られる数字だぞ。両チームの
得失点の平均をとり、ホームチームに 3 点を与えてみたらどうだ。この単純なモデルで試してみたらどうだ
ろう。」
彼らのデータセットのもとでこの簡易 Clyde モデルを試してみると、すべての試合の 59.02 % を正しく予
想できた。彼らの一見洗練された機械学習モデルよりもずっと良い。その後彼らは改良を重ね、最終的に
PageRank ベースのモデルを作り、少し良い結果(60.61 %)を出した。しかし、Clyde でもベースラインモ
デル
*
4