Python实战｜用决策树实现NBA获胜球队预测

2024-07-07 14:40| 来源: 网络整理| 查看: 265

NBA预测获胜球队数据获取

因为疫情原因导致NBA2019-2020赛季没有进行完，所以我们使用NBA2018-2019赛季的数据进行预测，数据获取方式有下面两种：

通过网站获取

我们可以通过网站去获取任意一年的所有场次比赛数据，获取方式如下：

在浏览器中访问https://www.basketball-reference.com/leagues/NBA_2019_games.html点击Share&more点击Get table as CSV (for Excel)复制连带表头的所有数据到Excel的文本文件中依次选择每一个月份，复制不带表头的数据到上一个文件后

同时我们还需要获取上赛季积分榜的数据，获取方式如下：

在浏览器中访问https://www.basketball-reference.com/leagues/NBA_2018_standings.html点击Expander Standings，可以看到整个赛季的战况信息点击Export链接复制数据并保存即可

通过GitHub获取

本文中的数据和代码已经上传到GitHub上，链接如下：https://github.com/bigdatavalley/NBA_predict

数据准备

在进行预测的算法设计之前，我们需要先进行数据的查看和整合，由于原有数据中很多的特征名称设定的不是很好，所以我们在加载数据的时候重新设定一下列名称，代码如下：

import pandas as pd path = 'basketball.csv' dataset = pd.read_csv(path, parse_dates=['Date']) dataset.columns = [ 'Date', 'Start(ET)', 'Visitor Team', 'VisitorPts', 'Home Team', 'HomePts', 'OT?', 'Score Type', 'Notes' ] dataset.head()

运行结果如下：

在这里插入图片描述

我们在建立预测模型的时候通常会有一个标准，当我们的预测效果超过这个标准的时候我们就可以认为预测模型起到了作用，接下来我们来建立一个关于预测球队获胜的标准。

在NBA比赛中，通常分为主客场，当球队在主场比赛的时候往往会占据一定的优势，那么如果我们每次都预测主场球队获胜，应该也能得到不错的准确率，那么我们就可以用这个数值来当作我们的标准，代码如下：

# 提取新特征 # 统计客队得分小于主队的场次 dataset['HomeWin'] = dataset['VisitorPts'] visitor_rank) dataset.at[index, 'HomeTeamRanksHigher'] = int(home_rank

【本文地址】

公司简介

联系我们