论文部分内容阅读
随着互联网发展和当今人们对各种竞技赛事的关注提高,美国职业篮球联赛、欧足联冠军联赛、国际足联世界杯等顶尖赛事是当今世界规模最大、运营最成功的联赛之一,不仅吸引了全球最好运动选手汇聚于此,同时引领着该运动项目的的发展方向。不但娱乐圈明星,运动圈也有着人们热衷球星,对球星的崇拜、对运动员赛场激情对抗、再加上成功商业推广,使得越来越受全球人们的欢迎和关注。由于竞技体育火爆人气及存在着巨大商业价值,各大型体育博彩公司、大型体育网站抓住此商机纷纷对赛事进行博彩竞猜及进行数据统计,给出各大团体历史战绩状况,并对团体进行胜负排名。而比赛关注者也往往是根据胜负排名评价团体实力强弱,或者根据自己直觉、偏好对团体实力进行评估。但实际上团体实力是很难从一两场比赛中提现出来的,不但要考虑团体的胜率还需要对比团体比赛中对方的实力,必须经过漫长赛季比赛才反映出来,普通关注者更是很难准确地预测下一轮比赛的胜负,从而博彩公司能够稳赚不亏地营运下去。由于胜率并不能正确反映团体实力,迫切需求一种更具准确的评估团体实力的方法来帮助关注者更好地去分析比赛结果,及明智地进行博彩投注,处于大数据时代的今天,获取各类球赛的历史数据是比较容易的,那么我们可以根据已有历史比赛数据来进行科学合理的评估。针对以上问题,为了更准确地预测各类团体胜率,本文选取传统用于评估网页排名的Page Rank算法对团体实力进行评估,通过对算法进行重新定义,使之适合用于竞技体育领域。在众多的竞技体育中,NBA是最受国内外欢迎球类比赛,因此选取NBA的30支球队常规赛的真实比赛数据作为作为实验数据集,在阐述Page Rank算法原理之后,使用PageRank算法实现了评估竞技团体实力的方法,根据实验结果验证Page Rank算法具有更好的优势,随后指出Page Rank算法应用于评估团体实力不足,在此基础上,提出一种基于Page Rank算法改进的算法——Sport Rank算法,Sport Rank继承了Page Rank算法的优点同时,把历史比赛对手实力和比赛中团体间得分分差两个关键因素考虑进去,相比传统评估团体实力方法更加全面,最后介绍Hadoop大数据处理平台,并通过Hadoop平台实现Page Rank算法和Sport Rank算法对海量数据进行计算,通过实验结果对比证实Sport Rank更准确、可靠。