中国研究生数学建模竞赛获奖数据和可视化分析案例(R语言) 您所在的位置:网站首页 同名不同校 中国研究生数学建模竞赛获奖数据和可视化分析案例(R语言)

中国研究生数学建模竞赛获奖数据和可视化分析案例(R语言)

2024-06-26 12:49| 来源: 网络整理| 查看: 265

收集了2004年(第一届)至今中(全)国研究生数学建模竞赛获奖数据,并基于R语言,进行了数据处理和可视化的工作。 这项工作最初的起因是,作者和队友在2015、2016、2017年参赛并获奖后,好奇一共有多少人连续获奖以及他们来自于哪个省份和学校。于是2017年底,我开始收集数据、敲代码。由于当时正值毕业,也面临着从matlab转出选语言的问题,认准R语言的我便开始使用R来写这部分代码,因此当时那一版惨不忍睹。2018年9月15日,台风山竹正面袭击广州深圳,被迫呆在家里的我,发现正好是当年落户杯开赛的日子,于是我决定把这个代码重写了一遍,并发布到github上。2020开年的新冠肺炎疫情期间,没法去办公室的我,看了Hadley 大神的Advanced R一书,并整合自己2019年所学,开始重新审视自己的编程水平,于是决定再一次修改这个代码,并且决定,以后每年都要来修改一次,以见证每年收获和进步。 关于项目的几个说明: 中国研究生数学建模竞赛(原名全国研究生数学建模竞赛),官网网址(新),官方网址(旧),2004年开办,每年9月开赛、11月~12月会公布当年获奖结果,旧网址曾经有历年数据,不过目前404了; 官方公布的获奖名单,包含一等奖、二等奖、三等奖以及成功参与(参赛、参加)奖,但是基本上参赛、提交并未被认定为作弊就能拿到成功参与奖,所以这里将获奖名单视为参赛名单,其中的一二三等奖视为获奖; 部分年份获奖名单中无题型信息,则视其题型全部为N; 对于个人“连续获奖”这个概念,每个版本可能有不同算法,但基本原则是: 鉴于信息有限,只考虑同名、同学校在连续年份的获奖情况为“连续获奖”,即忽略“山大张三在2005年获奖后转学到中大并于2006年获奖” 鉴于信息有限,不区分同名不同人、但同校名的获奖情况,即将“山大张三于2005年获奖然后另一个也叫张三的山大学生于2006年获奖”,视为连续2次获奖 如果张三于2005年获奖,并于2007、2008年获奖,则将其视为两次连续获奖,第一次为1连,第二次为2连



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有