[加密指南针]基于均值场博弈理论创立的CP505协议在杯赛制中的博弈机制创新

62
在国际公开的大型杯赛体系中,国际上合法博彩集团扮演了制定游戏规则这个重要的角色,对整个体育产业资本都有着举足轻重都影响。每次大型世界赛事,例如世界杯足球赛,博彩公司给出所有参赛球队的赔率,而全球的球迷会根据自己的喜好,选择各自的球队进行投注
okx

在国际公开的大型杯赛体系中,国际上合法博彩集团扮演了制定游戏规则这个重要的角色,对整个体育产业资本都有着举足轻重都影响。每次大型世界赛事,例如世界杯足球赛,博彩公司给出所有参赛球队的赔率,而全球的球迷会根据自己的喜好,选择各自的球队进行投注。[ 1 ]

这其中的赔率设定涉及到非常复杂的数学分析设定,是整个竞技博弈中的核心。正因为赔率是根据参赛队的实力、球员当前状态、球队历史表现等一系列指标进行加权计算,由博彩公司主观的给出。对博彩公司最理想的状况是任意一个比赛的结果,玩家的筹码胜负结果可以互相抵消,博彩公司赚取无风险的手续费,这是非常理想也是完全正常的商业模式。

然而因为竞技体育存在着很多偶然性,并且球迷会有天然的倾向,在某些时候,涉及到全球关注的重要比赛,全球投注的巨大金额,会出现大量的押注单一方向。结果会导致一旦比赛爆冷,大部分玩家猜错了,博彩集团会有超额收益,少部分压中玩家也会获得巨大收益,但一旦大部分玩家压中,博彩集团将面临巨额赔付。

尽管今天的赔率制度已经发展到了非常复杂的数学模型以及通过互联网实现了实时调整赔率的动态机制,但有时候球迷对某些球队对喜爱是会严重影响真实实力对。很多极端的情况,会导致博彩集团面临风险。例如 2014 年世界杯半决赛德国对巴西,两个队排名和水平接近,理论上赔率应该相差不大,但巴西有主场优势,并且 2014 年的巴西队群星闪耀,得益于互联网在全球的快速发展,使得巴西队拥有海量的热爱者,这导致当时出现了历史罕见的一边倒押注,绝大多数的筹码都放在巴西最终获胜晋级决赛上面,博彩公司面临大赚和大亏的两难选择,被迫成为绝大多数资金的对手盘,这对任何博彩集团来说,都是不可接受的。虽然没有证据表明比赛被操纵,但在历史上这次比赛中,德国队在巴西主场以 7 : 1 的比分,大胜具有主场优势的夺标最大热门巴西队,获胜晋级,这个赛前无法想象的比分也几乎没有玩家猜中。从结果来看,博彩公司是最大的获益者。而在国际所有赛事中,球迷都总结出一个没有科学依据的规律,“大热必死”,但其实这背后是由于零和博弈带来的巨大风险,让“大热”的队伍“死亡”是降低商业风险最无奈的办法。而这条朴素的,由球迷们总结出来的规律是如此的不符合概率学,也间接证明了,存在信息不对称干预比赛的结果。

传统的博彩集团,虽然从商业模式上,不是以下场参与对赌为目的,但单纯的赔率投注方法,一定有概率需要博彩集团赔出更多的赌注,想要从源头上遏制人为干预比赛,绝不是制定法律法规严格执法去杜绝人为干预,而是需要从机制上改变传统的由庄家主动给出赔率的博弈方式。随着区块链技术的日益成熟,利用区块链技术的透明性、去中心化性、可编程性,能够实现让游戏规则不可被任何人篡改,通过多个标准协议的组合,本文提出了一种基于均值场博弈理论的全新博弈合约 CP 505 协议。

二、相关工作

2.1 均值场博弈理论 (Mean Field Games, MFG)

Pierre-Louis Lions 等人在 2006 至 2007 年提出的均值场博弈理论[ 2 ],为大量同质智能体参与的博弈提供了均衡解。该理论在数学上描述了在大量参与者的系统中,个体如何基于其他参与者的统计学上的行为来做出最优决策。

2.2 博弈论 (Game Theory)

博弈论[ 3 ]是研究具有冲突和合作特征的决策者之间互动的数学理论。它为理解和预测赛会制博彩游戏中的策略行为提供了框架。

2.3 市场机制设计 (Market Mechanism Design) [ 4 ]

市场机制设计关注如何设计市场规则以实现特定的经济目标,如效率、公平性和透明度。

2.4 加密货币和区块链技术 (Cryptocurrency and Blockchain Technology)

加密货币和区块链技术提供了一种去中心化的价值转移机制,它为创建透明和不可篡改的博彩游戏平台提供了技术基础。[ 5 ]

2.5 行为经济学 (Behavioral Economics)

行为经济学结合了心理学和经济学,研究人们在经济决策中的非理性行为,这对于理解和设计博彩游戏的用户互动具有重要意义。[ 6 ]

2.6 赛会制博彩市场分析 (Tournament Betting Market Analysis)

对赛会制博彩市场的分析,包括赔率设定、市场流动性和信息效率,为设计博彩游戏提供了实证研究基础。[ 7 ]

2.7 囚徒困境

一个经典的二人非合作博弈模型,其中每个参与者的从个体最优选择出发的决策,导致了对所有参与者都较差的结果。这个概念最早由阿尔伯特·W·塔克在 1950 年提出。[ 8 ]

2.8 多人博弈的计算困难性

随着博弈参与者数量的增加,找到均衡解的难度显著增加。这是因为博弈的策略空间随参与者数量呈指数增长,导致计算均衡变得更加复杂。[ 9 ]

2.9 多人博弈的均衡

在多人博弈中,纳什均衡可能不存在或难以找到,这是因为每个参与者的最优响应策略依赖于其他所有参与者的策略,而每个人的策略选择空间都很大。[ 10 ]

三、理论基础与模型构建

3.1 均值场博弈理论在假设中的应用

如果用户的每一份投注都可以变成无数的碎片进行交易,由市场来对碎片自由定价,而这些碎片又能自由的实现全新的投注,这就将传统的赔率方式,转化为了一种金融方式。而问题从分析研究用户的投注问题,转化为分析用户的金融行为,进而转化为近乎无限的同质对手的博弈策略问题。

在经典的博弈论中,游戏发生在场景中的对手之间,通常只涉及两个人,比如著名的囚徒困境问题。涉及三个对手的游戏在计算上是非常困难的,很难达到均衡,这就是为什么西部片《好人、坏人和丑陋的人》如此经典。如果参与游戏的人数达到四个、五个或更多,从数学上来说是无法解决的,这里面所说的无法解决,是指没有所谓的最佳策略,因此游戏的参与人无法采用趋同的策略。

然而,如果游戏中的对手数量可以被认为是无限的,从数学上来说是有解的。法国数学家、菲尔兹奖得主 Pierre-Louis Lions 和其他几位数学家在 2006 年至 2007 年提出均值场博弈理论,对于一个近乎无限的同质对手参与的游戏,可以从数学上得到均衡状态下的概率分布,从而得到游戏参与者在均衡点处的最佳策略。

当均值场博弈理论在刚开始被提出时,人们并没有认为这个理论在金融领域有任何应用。建立均值场博弈理论的前提是游戏的对手是同质的,而在传统金融市场中,游戏对手的能力和类型完全不同,有具有内幕知识和实际执行力的公司管理层,有机构和大账户,还有许多个人投资者,正因为游戏的对手不同质,所以总是存在操纵,例如股价不是一个公平博弈的结果,掌握内幕消息的大股东或者管理层,或者看清了筹码分布的大资金,这些通常是股价的操纵者。

3.2 均值场博弈理论

均值场博弈(mean field game,MFG)理论专门探讨数量庞大的智能体(agent)在竞争环境下所使用的策略,每个智能体都会因应身边其他智能体所采取的行动而随之应变,务求令自可获得最大利益。

智能体的假设通常包括以下几点:

  • 1.同质性:所有智能体都是同质的,即它们具有相同的偏好和决策能力。

  • 2.大量智能体:系统中存在大量的智能体,以至于单个智能体的行为对整个系统的影响可以忽略不计。

  • 3.相互作用的简化:智能体之间的相互作用通过智能体行为的平均效应(即均值场)来简化表示,而不是通过个体间的直接相互作用。

  • 4.连续时间:智能体的行为和决策过程通常在连续时间框架下进行建模。

  • 5.理性:智能体被假设为理性的,即它们会根据自身的利益最大化目标来选择最优策略。

  • 6.信息结构:在某些模型中,智能体可能具有不同的信息结构,例如完全信息或不完全信息。

  • 7.策略选择:智能体会根据其他智能体的平均行为来调整自己的策略,以实现个体效用的最大化。

  • 8.稳定性和均衡:智能体的行为会趋向于某种均衡状态,如纳什均衡,这是 MFG 理论分析的重点之一。

  • 9.分布式决策:智能体的决策过程是分布式的,没有中央协调机构。

3.3 构建类似智能体假设

在传统赔率制中,由于赔率是博彩公司制定的,所以,所有的球迷投注,仅仅是出于自己对球队的喜爱程度或者客观估计,以及博彩公司制定的赔率是否存在套利空间,大部分用户的个人行为是无法影响其他人的行为,而其他人的投注行为,也不会影响我的投注行为。而当由于大量用户的行为导致赔率有变化时,投注用户也不能撤回投注,改变自己策略,一旦下定之后,就没有任何反悔的机会。这就不符合均值场博弈的假设。

但当应用区块链技术和智能合约技术,允许每一个用户将自己的投注都可以碎片化,形成强流动性的交易品,由市场用户二次决定碎片价格,进而间接实现用户改变自己的策略,进而影响他人的策略,这些用户的行为,就非常接近均值场博弈理论中的智能体的行为。

一旦我们的模型能够有机会使大量参与用户成为近似的智能体,那么,根据均值场博弈理论,是有可能会有最优解出现的,这个最优解往往是一组复杂的纳什均衡。

3.4 纳什均衡特点概述

  • 1.非合作性:在非合作博弈中,每个智能体独立选择自己的最优策略,不考虑其他智能体的利益。

  • 2.策略组合:纳什均衡是所有智能体策略的一个特定组合。在均衡状态下,每个智能体的策略是对其他智能体策略的最佳响应。

  • 3.稳定性:纳什均衡是一种稳定状态,即在没有外部干预的情况下,没有智能体会从改变自己的策略中获益。

  • 4.预测性:在博弈论中,纳什均衡提供了一种预测博弈结果的方法,因为它代表了一种自我强化的策略状态。

  • 5.可能的多重均衡:在某些博弈中,可能存在多个纳什均衡,每个均衡都代表了一种可能的博弈结果。

  • 6.理性假设:纳什均衡的成立基于智能体是理性的,即它们会根据自身的利益最大化目标来选择策略。

  • 7.效用最大化:在均衡状态下,每个智能体在给定其他智能体策略的情况下,选择了能够最大化自己效用的策略。

3.5 假设模型的理论框架

大量玩家参与的博彩游戏,在没有庄家的情况下,这些大数量的玩家属于同质智能体,符合均值场博弈的成立条件。同时这些玩家无法与数量众多的其他玩家达成合作博弈,因此均值场博弈也属于非合作博弈。

纳什均衡带给我们一个重要的价值,也就是在这个模型下的所有用户不再是一种“赌博”,因为用户在非合作条件下,如果他是理性的,只能采取某个确定的策略,或者叫支配型策略,这个策略对自己最有利。纳什均衡通常对小数量的玩家有效,理性玩家都采取支配型策略,达成了某种均衡。均值场博弈与纳什均衡的前提都是非合作博弈,均值场博弈所达成的均衡可以理解为无数个纳什均衡的组合结果。

传统的赔率博彩,只能是在给定赔率下的零和博弈,一旦最大的参与方(博彩集团)发现有巨额赔偿风险,就极有可能通过各种方式干预比赛结果,进而出现极大的不公平。而在

欧易

欧易(OKX)

用戶喜愛的交易所

币安

币安(Binance)

已有账号登陆后会弹出下载

进群交流|欧易官网