book

使用 Python 和 R 进行足球分析

Name: 使用 Python 和 R 进行足球分析
ISBN: 9798341658615

by Eric A. Eager, Richard A. Erickson

May 2025

Intermediate to advanced

352 pages

4h 54m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
本书适合人群本书不适合人群我们如何思考数据以及如何使用本书足球实例您将从我们的书中学到什么本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.足球分析
棒球有三种真正的结果：足球有吗？跑卫重要吗？数据如何帮助我们理解传球数据的内涵您能战胜困难吗？球队会击败选秀吗？足球分析工具Python 和 R 初试数据示例：谁投得深？R 中的 nflfastRPython 中的 nfl_data_py本章使用的数据科学工具建议阅读
2.探索性数据分析：稳定与不稳定的四分卫统计数据
界定问题获取和筛选数据总结数据绘制数据图直方图方框图球员级别的每次尝试传球码数稳定性深传与短传那么，我们应该如何利用这一洞察力呢？本章使用的数据科学工具练习建议阅读
3.简单线性回归：冲刺码数超出预期
探索性数据分析简单线性回归谁是《RYOE》中的佼佼者？RYOE 是更好的衡量标准吗？本章使用的数据科学工具练习建议阅读
4.多元回归：冲刺码数超出预期
多元线性回归的定义探索性数据分析应用多元线性回归分析 RYOE那么，跑卫重要吗？线性假设本章使用的数据科学工具练习建议阅读
5.广义线性模型：完成百分比超过预期
广义线性模型建立一个 GLMGLM 应用到完成百分比CPOE 是否比完成百分比更稳定？关于残差指标的问题赔率简介本章使用的数据科学工具练习建议阅读
6.将数据科学用于体育博彩：泊松回归与传球达阵
足球的主要市场泊松回归的应用：道具市场泊松分布球员个人市场和建模泊松回归系数关于 GLM 的结束语本章使用的数据科学工具练习建议阅读
7.网络抓取：获取和分析选秀
使用 Python 进行网络抓取用 R 进行网络抓取分析 NFL 选秀喷气机队/灰熊队2018年交易评估有些球队比其他球队更善于选拔球员吗？本章使用的数据科学工具练习建议阅读
8.主成分分析和聚类：球员属性
网络抓取和可视化 NFL 球探组合数据PCA 简介所有数据的 PCA聚类组合数据用 Python 对组合数据进行聚类用 R 对组合数据进行聚类关于集群的结束语本章使用的数据科学工具练习建议阅读
9.高级工具和后续步骤
高级建模工具时间序列分析超越 PCA 的多元统计定量回归贝叶斯统计和层次模型生存分析/事件发生时间贝叶斯网络/结构方程建模机器学习命令行工具bash 示例bash 推荐阅读版本控制GitGitHub 和 GitLabGitHub 网页和简历Git 推荐阅读样式指南和词法套餐套餐推荐阅读计算机环境共享数据的互动工具和报告工具人工智能工具结论

A.Python 和 R 基础知识
获取 Python 和 R本地安装基于 Cloud 的选项脚本Python 和 R 软件包nflfastR 和 nfl_data_py 提示集成开发环境Python 基本数据类型基本 R 数据类型
B.汇总统计和数据处理：传球
基本统计数据平均值变异性和分布估算的不确定性筛选和选择列用 Python 和 R 计算汇总统计数据关于列报简要统计数据的说明改进演讲练习建议阅读
C.数据整理基础
逻辑运算符过滤和排序数据清洁R 中的管道检查和清除数据中的异常值合并多个数据集
术语表
索引
关于作者

Content preview from 使用 Python 和 R 进行足球分析

第 7 章网络搜索：获取和分析选秀权

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

美式足球公共分析领域的一大胜利是nflscrapR ，之后是nflfastR 。通过这些软件包，可以轻松分析我们都热爱的比赛。将数据纳入您的计算空间往往就像下载 Python 或 R 的软件包一样简单，然后就可以走了。

但有时并不那么容易。通常，你需要自己从网上搜刮数据（使用计算机程序下载数据）。虽然用 Python 和 R 教你所有的网络搜刮方法已经超出了本书的范围，但一些相当简单的命令就可以让你获得大量的数据来进行分析。

在本章中，你将从Pro Football Reference（职业橄榄球参考）中获取 NFL Draft 和 NFL Scouting Combine 数据。这是宾夕法尼亚州费城的一个绝佳资源。该网站隶属于 Sports Reference 公司，后者也提供各种体育运动的免费数据。您将使用该网站获取 NFL 选秀和 NFL 球探组合的数据。

NFL 选秀是一年一度的盛事，在全国多个城市举行。在选秀大会上，各队从高中毕业后至少完成三年学业的球员中选拔球员。虽然过去有更多轮，但 NFL 选秀目前由七轮组成。每轮的选秀顺序取决于各队前一年的表现。弱队的选秀顺位高于强队。球队可以用选秀权换取其他选秀权或球员。

NFL 球探甄选大会是一年一度在印第安纳州印第安纳波利斯举行的盛会。在选秀大会上，一批有资格参加 NFL 选秀的运动员与 NFL 球队的评估人员会面，进行各种身体和心理测试。此外，这通常被认为是 NFL 一年一度的大会，各队与经纪人之间的交易都在这里达成，有时甚至最终敲定。

这两个数据集的组合是足球分析初学者的绝佳资源，原因有以下几点。首先，数据是每年一次在几天内收集的，此后不会再有变化。虽然有些球员可能会在日后重新进行身体测试，球员也经常会因为各种原因离开选中他们的球队，但选秀球队是不会改变的。因此，一旦获得数据，通常可以使用几乎整个日历年，之后只需在下一年获得新数据时添加即可。

您将从 2022 年开始搜索所有 NFL 球探联合试训和 NFL 选秀数据，然后再加入以后年份的数据进行分析。

提示

Web scraping涉及大量的试验和错误，尤其是在刚开始的时候。一般来说，我们会先找到一个可行的例子，然后逐一修改，直到达到我们的要求。

使用 Python 进行网络抓取

提示

在开始网络搜刮之前，请先进入网页，以便查看要下载的内容。

下面的代码允许我们通过使用for 循环来使用 Python 进行 scrape。如果您跳过了这几章或需要提醒，"球员个人市场和建模 "提供了for 循环的介绍。将的统一资源定位符（URL）或网址保存到一个对象url 中。在本例中，URL 只是 2022 年 NFL 选秀的 URL。

接下来，使用pandas 软件包中的read_html() 从给定的 URL 读取表格。请记住，Python 从 0 开始计数。因此，数据帧的第 0 个元素，即来自read_html() 的draft_py ，只是网页上的第一个表格。您还需要将NA 草稿中的近似值改为0 ：

## Python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import statsmodels.formula.api as smf
import numpy as np

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341658615

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

使用 Python 和 R 进行足球分析

by Eric A. Eager, Richard A. Erickson

第 7 章网络搜索：获取和分析选秀权

提示

使用 Python 进行网络抓取

提示

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.