基于机器学习的足球比赛胜负实时预测方法(19)
采用堆叠的方法对历史特征和实时特征进行融合和过滤,然后利用平均进球数、平均射门数、积分榜等进行扩展并完成特征生成。 通过建立图卷积深度神经网络模型,实现足球比赛结果的实时预测。 与仅利用历史数据进行比赛预测的算法相比,准确性有所提高。 B6 4 5 6 6 7 2 1 1N C CN B 权利要求第1/2页 1、一种基于机器学习的足球比赛结果实时预测方法,其特征在于,包括以下步骤: S1:根据不同类型的足球比赛每场足球比赛的特征数据分为三部分:球队和球场信息、赛事流信息、轨迹信息; S2:对所有足球比赛历史数据进行特征提取和筛选,并确定历史球员的评分标签,将筛选后的足球比赛历史数据与历史球员的评分标签整合,构建历史数据集; S2具体为: S21:对所有足球比赛历史数据进行球队、球场信息及上述轨迹信息的特征提取,并对特征提取后的历史足球比赛数据进行过滤; S22:球员的历史评分标签来自于网站,通过比赛日期、球队、球衣号码与过滤后的历史特征数据进行整合,构建历史数据集; S3:将历史数据集划分为训练集和测试集,确定评价指标和评价模型,获得选手的历史成绩; S4:对所有实时足球比赛数据进行特征提取和过滤,并设置事件流信息的标签,将过滤后的足球比赛实时数据与事件流信息标签进行整合,构建实时数据放; S5、将实时数据集划分为训练集和测试集,并确定评价指标、评价模型和评分算法,获得选手的实时成绩; S5具体包括:将实时数据集按照8:1的比例划分为训练集和测试集,选择TTEE和EPA作为评价指标,并使用VAEP算法对选手进行实时评分。 S6:对玩家历史得分和玩家实时得分进行特征融合和扩展,生成新的特征数据集; S6具体是:结合球员的历史得分特征,通过短时傅里叶变换(STFT)中的滑动窗口思想与球员的实时评分融合,并通过引入场均进球数、球队积分榜等进行扩展。团队力量特征来生成新的特征数据集。 ; S7、将新特征数据集划分为训练集和测试集,确定评价指标和预测算法,训练预测模型得到预测结果; S7具体为:将特征数据集按照8:1的比例划分为训练集和测试集,评价指标选择查准率和查全率; 预测算法选择图卷积网络和深度卷积网络的组合结构来训练预测模型。
2.根据权利要求1所述的基于机器学习的足球比赛胜负实时预测方法,其特征在于,所述主客队信息包括主客队球员的姓名、位置、以及体育场的大小; 比赛事件信息包括足球比赛过程中的信息。 发生的事件记录了与该事件相关的玩家、事件名称、事件坐标; 坐标信息用于记录每个事件流中所有球员和足球的位置坐标。 3.根据权利要求1所述的基于机器学习的足球比赛胜负实时预测方法,其特征在于,所述S3具体为:将所述历史数据集按比例划分为训练集和测试集。 3:1。 放; 评价指标为均方根误差; 22 CN B权利要求2/2页计分模型分为4个模型:前锋球员、中锋球员、后卫球员和守门员球员; 历史玩家评分采用岭回归算法。 4.根据权利要求1所述的基于机器学习的足球比赛胜负实时预测方法,其特征在于,所述S4具体为: S41:对所有实时足球比赛数据的事件流信息进行特征提取。 ,对特征提取后的足球比赛实时数据进行过滤; S42:根据进球标签和失球标签标记球员的实时得分标签,并通过当前时刻的事件信息和前三个时刻的事件信息来丰富时间。 将维度信息与过滤后的实时特征数据相结合,并结合两队当前时刻的进球数和净胜球数,得到实时数据集。
33 CN B 说明书第1/4页 一种基于机器学习的足球比赛结果实时预测方法 技术领域 [0001] 本发明涉及足球比赛结果预测领域,具体涉及足球比赛结果预测领域。一种基于机器学习的实时预测足球比赛结果的方法。 负预测方法背景技术 [0002] 足球作为世界上最受欢迎的运动项目,能够带来明显的经济效益和社会效益。 尽管中国足球的成绩并不是很理想,但其市场在国内仍然占据着主导地位。 因此,足球产业的进步对于整个国内体育市场的拓展有着积极的推动作用。 足球比赛数据分析可以定量表征球场信息和球员状态,为制定战术安排、预测比赛结果提供可靠帮助。 [0003] 在预测足球比赛的胜负方面,目前的方法大多针对赛前预测,此类方法主要根据球队的整体实力进行预测。 足球比赛瞬息万变,仅根据球队历史信息进行预测存在一定的局限性。 足球比赛的胜负还与球员的竞技状态以及比赛过程中发生的事件信息有关。 随着机器学习的发展,机器学习算法思想已经应用于具体工程问题中的许多有效方法足球比赛预测模型,这也为足球比赛结果的实时预测提供了解决方案。 发明内容 [0004] 为了解决上述技术问题,提供了一种基于机器学习的足球比赛结果实时预测方法,解决了当前比赛结果的预测问题。足球比赛只能基于历史信息,无法利用现场信息进行实时比赛。 这不是一个很高的问题。
[0005] 为了实现上述目的,本发明提出一种基于机器学习的足球比赛胜负实时预测方法,包括以下步骤: [0006] S1:根据不同类型的特征足球比赛的数据,每场足球比赛的结果特征数据分为三部分:球队和赛场信息、赛事流信息、轨迹信息; [0007] S2:对所有足球比赛历史数据进行特征提取和筛选,确定历史球员的评分标签,将足球比赛的历史数据与历史球员的评分标签整合,构建历史数据集; [0008] S3、将历史数据集划分为训练集和测试集,并确定评价指标和评价模型,得到玩家的历史评分。 [0009] S4:对所有足球比赛实时数据进行特征提取和过滤,并设置事件流信息标签,将筛选出的足球比赛实时数据与事件流信息标签进行整合,构建实时足球比赛实时数据。数据集; [0010] S5:将实时数据集划分为训练集和测试集,并确定评价指标、评价模型和评分算法,得到选手的实时成绩; [0011] S6:结合玩家的历史得分和玩家的实时评分进行特征融合和扩展,生成新的特征数据集; [0012] S7:将新特征数据集划分为训练集和测试集,确定评价指标和预测算法,训练预测模型得到预测结果。
[0014] 优选地足球比赛预测模型,所述S2具体为: 44 CN B指令第2/4页 [0014] S21:对所有足球比赛历史数据进行球队、球场信息和轨迹信息的特征提取,对所有足球比赛历史数据进行特征提取。 对特征提取后的足球比赛历史数据进行过滤; [0015] S22、来自网站的球员历史评分标签,将比赛日期、球队、球衣号码与过滤后的历史特征数据进行整合,构建历史数据集。 [0016] 优选地,所述主客场信息包括主客场球员姓名、位置、场地大小; [0017] 比赛事件信息包括足球比赛过程中发生的事件,记录事件相关的球员、事件名称、事件发生坐标; [0018] 坐标信息用于记录每个事件流中所有球员和足球的位置坐标。 [0019] 优选地,所述S3具体为: [0020] 将所述历史数据集按照3:1的比例划分为训练集和测试集; 评价指标为均方根误差; 得分模型分为前锋球员、中锋球员、后卫球员、守门员球员4种模型; 历史玩家评分采用岭回归算法。 [0021] 优选地,所述S4具体为: [0022] S41:对所有实时足球比赛数据进行事件流信息的特征提取,并对特征提取后的实时足球比赛数据进行过滤; [0023] S42、根据进球标签和进球标签分别标注玩家的实时得分标签,并将过滤后的实时事件信息与当前时刻的事件信息和前三个时刻的事件信息进行整合。特征数据丰富了时间维度信息,并结合了当前时刻两队的进球数和净胜球数足球比赛预测模型,得到了实时数据集。
[0024] 优选地,所述S5具体为: [0025] 将所述实时数据集按照8:1的比例划分为训练集和测试集,选择TTEE和EPA作为评价指标,采用VAEP算法对选手进行实时评分评价。 [0026] 优选地,所述S6具体为: [0027] 通过短时傅里叶变换STFT中的滑动窗口思想对玩家的历史得分和玩家的实时得分进行特征融合,引入场均平均值。进球数、球队排名和球队实力特征被扩展以生成新的特征数据集。 [0028] 优选地,所述S7具体为: [0029] 将所述特征数据集按照8:1的比例划分为训练集和测试集,并选择查准率和查全率作为评价指标; 预测算法选择图卷积网络和深度卷积网络的组合结构来训练预测模型。 [0030] 与现有技术相比,本发明具有以下技术效果: [0031] 本发明可以根据历史比赛数据和位置获取每个玩家的历史得分,并获取每个玩家的实时游戏得分基于实时游戏数据的玩家。 本发明通过特征融合和扩展来组织实时胜负预测的数据集,通过图卷积网络模型和深度神经网络的组合模型完成足球比赛的实时胜负预测,解决了当前胜负的问题。足球比赛的预测只需要根据历史信息就能为预测比赛结果提供可靠的帮助,解决了无法利用现场信息而带来的实时性低的问题。
附图说明 [0032] 为了更加清楚地说明本发明实施例或现有技术中的技术方案,下面对实施例中所需使用的附图进行简单介绍。 显然,下面描述中的附图只是本发明的一些实施例。 对于本领域普通技术人员来说,基于这些附图,在不付出创造性劳动的情况下,还可以得到其他附图。 [0033] 图1为本发明的方法流程图; [0034] 图2为本发明历史数据处理的部分流程图; [0035] 图3为本发明实时数据处理的部分流程图; [0036]图4这是本发明的网络结构图。 具体实施方式 [0037] 下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。 显然,所描述的实施例仅仅是本发明的部分实施例,而不是全部示例。 基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。 [0038] 为使本发明的上述目的、特征和优点更加清楚易懂,下面结合附图和具体实施例对本发明作进一步详细说明。 [0039] 实施例一 [0040] 下面结合附图和足球联赛实时赛果预测案例对本发明作进一步说明。
[0041] 大型足球联赛的真实比赛数据持续8年,包括每个赛季的所有轮次比赛。 每场比赛数据主要分为三部分,球队及赛场信息、赛事流程信息和轨迹信息。 第一部分球队和球场信息包括赛季名称、比赛时间、球场规模以及参赛球队信息。 比赛球队信息包括两队名称、主客场信息以及球员相关信息。 足球比赛由比赛事件流组成。 第二部分事件流信息包含事件发生时间、事件相关球员、事件名称、事件地点坐标、主队得分、客队得分等丰富信息,记录时间精确到毫秒。 第三部分是轨迹信息,包括场上球员和足球的位置坐标信息。 记录间隔为100ms。 此外,还使用网站上的玩家评分。 [0042] 上述足球比赛相关数据可以参见图1所示的基于机器学习的足球比赛胜负实时预测方法的流程图来实现。 首先对历史数据进行过滤和整合,将比赛日期、球员ID、球队名称与网站评分进行匹配,构建历史数据集。 各个位置的球员通过岭回归算法得到各个位置球员的评分。 其次,对比赛赛事信息进行筛选和整合。 同时,以两队的进球数和净胜球数作为特征。 分别设置进球标签和失球标签。 评分概率通过GMM(高斯混合模型)使用,然后通过VAEP。 算法实时玩家评分。
引入场均进球数、球队积分榜、球队实力等特征来衡量球队的攻防能力,并通过STFT(短时傅里叶变换)与球员历史评分和球员实时评分相结合,完成一代。 保留与事件流关联的玩家 ID 的特征。 这样对每个事件整理出60维特征,将前七年的数据划分为训练集,第八年的数据作为测试集。 将训练数据输入深度神经网络模型进行训练,通过调整参数得到最优模型。 评估指标是精确率和召回率。 通过调整预测范围参数来调整预测所需的时间长度。 将测试数据集输入最优模型进行预测,并对测试结果进行分析,完成足球比赛结果的实时预测。 [0043]历史玩家评分获取流程如图2所示。对三部分游戏数据进行过滤和整合。 对于球队和球场信息,历史数据集的构建是通过将比赛日期、球员ID和球队名称与网站评分进行匹配来完成的。 对于事件流信息,记录重要的事件信息,例如球员传球、射门、定位球和解围,并删除与衡量球员能力不太相关的事件,例如暂停和出界事件。 对于轨迹信息,通过计算66 CN B手册第4/4页坐标之间的距离,可以计算出球员的速度和加速度,从而获得每个球员的跑动次数、跑动距离和高强度跑动次数在整个游戏中。
特征和标签整合后,与玩家个人信息密切相关的信息,例如玩家的昵称、玩家所在球队的名称等将被删除。 数据集分为前锋、中锋、后卫和守门员四个球员位置,训练集和测试集按照3:1的比例划分。 选择均方根误差作为评价指标,将训练集输入到岭回归算法模型中,通过调整参数得到最优模型。 将测试集输入到最优模型中,得到所有玩家的历史评分。 [0044] 其中,实时玩家评分获取流程如图3所示。获取实时玩家评分的主要依据是游戏数据中的事件流信息。 事件发生地点与对方球门之间的距离、双方进球数以及净胜球作为特征添加到特征列表中。 每个事件总共发生在 22 维数据中。 为了考虑时间维度信息,每个事件时刻的事件特征还应该包括前三个时刻的事件特征,以丰富特征维度。 球员实时评分数据集的标签分别标记进球数和失球数。 如果在预测事件窗口(设置为 10)内有进球或失球,则事件差异将用作标签。 如果指定的事件在事件窗口内没有发生,则设置为20。将前7年的数据作为训练集,第8年的数据作为测试集。 数据集通过GMM模型计算进球概率和失球概率。 基于VAEP(行为价值评估),计算该事件给对应玩家增加的积分,即得到玩家的实时评分。 [0045] 由于选择图卷积网络模型,参见图4。
将每个事件视为一个节点,并根据设定范围(50)内的玩家ID的特征来组合节点。 邻接矩阵的设定规则是50个赛事内同队球员之间的值为1,否则为0。设定范围内的赛事特征根据邻接矩阵特征进行组合,推导出新的特征并在同一团队的球员之间建立联系。 后面是三层神经网络,整个网络的损失函数是交叉熵损失函数。 将训练集数据输入网络,调整神经网络各层单元数量及其他参数,得到最优模型。 将测试数据输入到最优模型中,即可得到足球比赛结果的实时预测结果。 [0046] 本发明可以根据历史比赛数据和位置获得每个玩家的历史得分,并根据实时比赛数据获得每个玩家的实时比赛得分。 本发明通过特征融合和扩展来组织实时胜负预测的数据集,通过图卷积网络模型和深度神经网络的组合模型完成足球比赛的实时胜负预测,解决了足球比赛实时胜负预测的问题。当前足球比赛的胜负预测只需要根据历史信息就可以为预测比赛胜负提供可靠的帮助,并且解决了无法利用现场信息带来的实时性不高的问题。 以上所述实施例仅仅是对本发明的优选实施方式的说明,并不用于限定本发明的范围。 在不脱离本发明的设计精神的情况下,本领域的普通技术人员将做出本发明的技术方案。 各种修改和改进均应落在本发明权利要求确定的保护范围之内。 77 CN B 使用说明书,第 1/2 页图 1,图 288 CN B 使用说明书,第 2/2 页图 3,图 499
标签: 足球比赛预测模型