新闻动态

足球中的多智能体离屏行为预测——正规的足球外围网站社区精华

作者:小编时间:2022-11-03 15:51:17

在多智能体世界中,几个决策个体在遵守环境施加的动态约束的同时进行交互。这些相互作用,再加上智能体动态行为的潜在随机性,使得从决策的角度研究这些系统变得复杂而有趣。已经对用于代理行为前向估计的学习模型进行了重要的研究,例如,用于自动驾驶汽车中避免碰撞的行人预测。在许多情况下,在给定的轨迹序列中可能只有零星的代理观察。在足球比赛中,部分球员可能进出播放的视频画面,而未被观察到的球员继续在屏幕外进行互动。


正规的足球外围网站研究了人类足球比赛背景下的多智能体时间序列插补问题,其中可用的智能体子集过去和未来的观察结果用于估计其他智能体的缺失观察值。我们的方法,称为图形输入器,将过去和未来的信息与图网络和变分自动编码器结合使用,以学习估算轨迹的分布。我们展示了我们在涉及部分可观察玩家的多代理设置上的方法,使用GraphImputer来预测屏幕外玩家的行为。为了定量评估该方法,我们使用真实轨迹数据对足球比赛进行实验,使用摄像头模块模拟屏幕外球员状态估计设置。随后,我们使用成熟的球场控制框架在部分可观测性下使用我们的方法进行下游足球分析,该框架传统上依赖于完全观测的数据。我们说明我们的方法优于几种最先进的方法,包括那些为足球手工制作的方法,


image.png


多智能体行为的预测建模一直是机器学习、金融经济学、机器人技术和体育分析中相当感兴趣的话题.在这样的系统中,决策代理在共享环境中进行交互,遵循一个潜在的动态过程,该过程可能是随机的,并且由于涉及复杂的交互作用,通常无法进行分析表征。学习此类系统的动态模型可以理解和评估代理的行为。理想情况下,学习这种耦合动力系统模型的方法应该能够预测未来行为,追溯过去的行为,并最终对部分遮挡的数据进行插补,同时尊重可用观察施加的任何约束.在本文中,我们介绍了一种在时间遮挡下进行多智能体时间序列插补的方法,特别关注人类足球运动员的预测设置。在足球领域,它依赖于游戏中所有玩家的位置信息


足球是多智能体插补问题的一个特别有趣的测试平台,因为它涉及多个个体的动态交互以及由于所涉及的人类决策而产生的随机性。大量先前的工作针对多智能体轨迹的前向预测学习模型,在这些工作中,假设所有相关实体的观察流可用于一定数量的时间步长,之后预测实体子集的状态。但是,完整跟踪信息的可用性是一个限制性假设。在许多情况下,只有关于游戏状态的部分信息可用,因此需要对缺失数据进行插补。与之前的工作相比,我们针对这种未充分探索的多智能体插补机制,其中我们假设屏幕上玩家的可用观察结果,并试图预测未观察到的关闭状态。屏幕播放器,随后可用于下游足球分析。涉及交互实体的多元时间序列数据的插补除了足球之外还有各种实际应用。在金融市场中,某些外汇报价比其他报价更频繁,但这些金融工具之间的相关性可用于填补缺失数据0。____在临床试验中,多感官数据可能会产生不规则的测量结果,或者某些传感器在某些时间不可用。在自然语言处理中,以周围句子上下文为条件的文本填充是一个活跃的研究领域,并且可以自然地扩展到多智能体会话对话填充。


image.png


部分可观察的多智能体轨迹插补问题是一个新的机制,它与以前只考虑预测/未来预测的工作形成鲜明对比。本文的主要贡献如下。首先,我们介绍了一种多智能体插补技术,即使在给定轨迹序列中随机智能体子集的动态遮挡下也适用。我们的模型使用双向变分LSTM23和图形网络24的组合,并使用适当的元素来处理多智能体设置中感官观察的任意复杂遮挡。其次,我们说明了如何使用我们的方法来扩展现有的足球分析框架到部分可观察的设置。我们的实验是在包含105场全长真实世界足球比赛的大型套件中进行的,其中我们将我们的方法与许多现有方法进行了比较,包括社交LSTM7和图变分RNN据我们所知,这是对足球体制中轨迹插补模型的首次研究,并且具有释放大量先前分析技术对仅具有间歇性或部分-的足球比赛的适用性的潜力。可观察到的玩家跟踪信息。


正规的足球外围网站我们考虑了文献中尚未正式分析的多智能体时间序列插补的问题机制,与已经大量研究的前向预测机制形成对比。我们引入的方法称为GraphImputer,它使用双向循环模型的组合来确保使用所有可用的时间信息,并使用图网络来模拟代理间的关系。我们的实验侧重于足球分析机制,以说明此类模型的实用且直观的真实用例。我们说明了我们的方法在大型足球跟踪数据集上优于几种最先进的方法,并且定性地产生了轨迹样本,这些样本捕捉了球员的互动并遵守了可用观察所施加的约束。传统上依赖于完全观测数据的可用性。实证结果表明,我们的方法在原始轨迹预测性能和这些足球特定指标方面都优于强大的基线,甚至优于专门为足球制度手工制作的模型。


image.png


正规的足球外围网站模型的局限性之一是前向和后向潜在向量,在我们的模型中独立采样;从联合基础分布中采样这些可以显着改善方向预测中的相关性。此外,我们的模型需要在每个轨迹中至少观察一个时间步长的每个代理。虽然在实践中考虑到足够长的轨迹序列,这不是主要限制,但研究一种使模型能够无缝处理完全缺失的方法代理将增加其普遍性。该模型的另一个改进可能是在使用的双向融合方法中结合分布信息,利用现有信息过滤技术的思想。最后,请注意,在我们的方法中构建的训练数据集复制了相关方法的设置。即使在单个游戏中表达的行为的多样性也使得预测问题即使在这样的数据集拆分下也具有挑战性。尽管如此,在未来的工作中考虑迁移学习情况可能会很有趣,这可能对涉及视觉在环的情况感兴趣。


总体而言,我们的方法的主要好处是它的通用性,因为它允许任何代理子集在任何时间步长不被观察,适用于任意时间范围的时间遮挡,并且可以直接应用于足球以外的一般多代理领域。人体轨迹的预测建模是一个复杂的问题,具有许多应用,例如运动分析、道路上的行人建模和体育场中的人群建模。鉴于我们的方法相当普遍,未来工作的一个关键途径是将其应用于这些相关的预测建模机制。


光电训练系统

相关推荐