Python实战|用决策树实现NBA获胜球队预测 | 您所在的位置:网站首页 › nba上个赛季冠军的球队 › Python实战|用决策树实现NBA获胜球队预测 |
NBA预测获胜球队
数据获取
因为疫情原因导致NBA2019-2020赛季没有进行完,所以我们使用NBA2018-2019赛季的数据进行预测,数据获取方式有下面两种: 通过网站获取 我们可以通过网站去获取任意一年的所有场次比赛数据,获取方式如下: 在浏览器中访问https://www.basketball-reference.com/leagues/NBA_2019_games.html点击Share&more点击Get table as CSV (for Excel)复制连带表头的所有数据到Excel的文本文件中依次选择每一个月份,复制不带表头的数据到上一个文件后同时我们还需要获取上赛季积分榜的数据,获取方式如下: 在浏览器中访问https://www.basketball-reference.com/leagues/NBA_2018_standings.html点击Expander Standings,可以看到整个赛季的战况信息点击Export链接复制数据并保存即可通过GitHub获取 本文中的数据和代码已经上传到GitHub上,链接如下:https://github.com/bigdatavalley/NBA_predict 数据准备在进行预测的算法设计之前,我们需要先进行数据的查看和整合,由于原有数据中很多的特征名称设定的不是很好,所以我们在加载数据的时候重新设定一下列名称,代码如下: import pandas as pd path = 'basketball.csv' dataset = pd.read_csv(path, parse_dates=['Date']) dataset.columns = [ 'Date', 'Start(ET)', 'Visitor Team', 'VisitorPts', 'Home Team', 'HomePts', 'OT?', 'Score Type', 'Notes' ] dataset.head()运行结果如下: 我们在建立预测模型的时候通常会有一个标准,当我们的预测效果超过这个标准的时候我们就可以认为预测模型起到了作用,接下来我们来建立一个关于预测球队获胜的标准。 在NBA比赛中,通常分为主客场,当球队在主场比赛的时候往往会占据一定的优势,那么如果我们每次都预测主场球队获胜,应该也能得到不错的准确率,那么我们就可以用这个数值来当作我们的标准,代码如下: # 提取新特征 # 统计客队得分小于主队的场次 dataset['HomeWin'] = dataset['VisitorPts'] visitor_rank) dataset.at[index, 'HomeTeamRanksHigher'] = int(home_rank |
CopyRight 2018-2019 实验室设备网 版权所有 |