合作博弈
好的,我们来详细解释一下 合作博弈。
核心思想: 合作博弈研究的是 一群参与者(称为局中人或玩家)如何通过结成联盟(Coalition)来合作,以获得比单独行动时更大的总收益,以及如何公平合理地分配合作产生的总收益(称为联盟值或特征函数值)。
与非合作博弈(如经典的囚徒困境、纳什均衡)关注个体在既定规则下的最优策略不同,合作博弈关注的重点是:
- 联盟的形成: 哪些参与者会组成联盟?
- 联盟的稳定性: 形成的联盟是否稳定?有没有参与者或子联盟觉得脱离出去能获得更多?
- 收益的分配: 联盟获得的总收益如何在成员间进行分配才被认为是公平、稳定且有效率的?
关键概念:
-
局中人(Players):
- 参与博弈的个体或实体,集合通常记为
N = {1, 2, ..., n}。
- 参与博弈的个体或实体,集合通常记为
-
联盟(Coalition):
- 由部分或全部局中人组成的子集
S ⊆ N。 - 大联盟(Grand Coalition): 包含所有局中人的联盟,即
S = N。通常是合作博弈最终追求的目标状态。
- 由部分或全部局中人组成的子集
-
特征函数(Characteristic Function):
- 记为
v(S)。这是一个定义在N的所有子集(即所有可能的联盟S)上的函数。 v(S)表示联盟S无论其他局中人(不在 S 中的局中人)采取什么行动 所能保证自身获得的最大总收益(或最小成本,此时为成本博弈)。- 它满足两个基本性质:
v(∅) = 0: 空联盟的收益为0。- 超可加性(Superadditivity): 如果
S ∩ T = ∅(即联盟 S 和 T 没有重叠成员),则v(S ∪ T) ≥ v(S) + v(T)。这意味着合并不相交的联盟不会降低总收益(通常会增加)。这是合作博弈的基础,体现了合作的价值。
- 记为
-
分配(Imputation/Allocation):
- 指对于一个大联盟
N,如何将在v(N)分配给所有局中人。一个分配方案是一个向量x = (x₁, x₂, ..., xₙ),其中:- 个体理性(Individual Rationality):
xᵢ ≥ v({i})对于所有i ∈ N。即每个人在大联盟中分到的收益,至少不能比他单干时 (v({i})) 差。否则他没有理由加入大联盟。 - 群体理性(Collective Rationality / Efficiency):
Σ_{i∈N} xᵢ = v(N)。即分配的总和必须等于大联盟的总收益。不能少分(亏损),也不能多分(无中生有)。
- 个体理性(Individual Rationality):
- 满足以上两个条件的分配方案称为 支付配置(Payoff Configuration) 或简称 分配(Imputation)(有时定义更严格)。
- 指对于一个大联盟
合作博弈的核心问题:公平分配
如何公平、稳定地将 v(N) 分配给各个局中人 i?合作博弈论提出了多种解的概念:
-
核心(The Core):
- 最直接体现联盟稳定性的概念。
- 一个分配
x属于核心,当且仅当 没有任何一个联盟S(包括单人和小团体)能通过脱离大联盟自己玩而获得比当前分配更高的总收益。数学表达:Σ_{i∈S} xᵢ ≥ v(S)对所有S ⊆ N成立。 - 核心的分配方案是稳定的,因为没有任何群体有动机脱离大联盟。然而,核心可能是 空的(不存在满足所有约束的分配),也可能是 非常大的集合。
-
夏普利值(Shapley Value):
- 由诺贝尔奖得主劳埃德·夏普利(Lloyd Shapley)提出,是最著名和应用最广的合作博弈解概念。
- 它基于四个公平公理(对称性、有效性、哑元公理、可加性)推导出一个唯一的分配方案。
- 计算公式:
φᵢ(v) = Σ_{S ⊆ N \ {i}} (|S|! (|N| - |S| - 1)! / |N|! ) * [v(S ∪ {i}) - v(S)] - 含义: 计算局中人
i对所有可能联盟S(不包含i)的 边际贡献[v(S ∪ {i}) - v(S)]的加权平均。- 权重:考虑
i加入联盟S的所有可能的排列顺序,该权重正好是i以特定顺序加入特定大小联盟S的概率(所有排列等可能)。
- 权重:考虑
- 夏普利值反映了每个局中人对大联盟总价值的 平均边际贡献,被认为是一个非常公平的分配方式。广泛应用于成本分摊、利润分配、投票权力分析(Shapley-Shubik 权力指数)等。
-
核仁(The Nucleolus):
- 当核心为空时,核仁寻求一种使“最不满意联盟”的不满程度降到最低的分配。
- 定义“超额(Excess)”:对于一个联盟
S和一个分配x,超额e(S, x) = v(S) - Σ_{i∈S} xᵢ。它衡量联盟S可以“抱怨”的程度(正数表示S觉得自己亏了)。 - 核仁是所有分配中,使得 最大超额最小化 的那个分配(按词典序最小化超额向量)。它总是存在且唯一(在支付配置空间)。
- 核仁更侧重于最小化最严重的不满情绪。
合作博弈 vs. 非合作博弈:
| 特点 | 合作博弈 (Cooperative Game) | 非合作博弈 (Non-cooperative Game) |
|---|---|---|
| 重点 | 联盟形成、收益公平分配 | 个体最优策略、策略互动与均衡 |
| 约束力 | 假设参与者能达成有约束力的协议 | 参与者独立决策,通常无(或弱)约束力协议 |
| 工具 | 特征函数 v(S)、分配方案 |
收益矩阵、策略集、反应函数、均衡概念(纳什均衡等) |
| 解概念 | 核心、夏普利值、核仁等 | 纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡等 |
| 目标 | 最大化并公平分配合作收益 | 预测个体行为及其结果 |
| 例子 | 股东利润分配、国家联盟谈判、选民投票权重分配 | 囚徒困境、古诺竞争、拍卖、价格战 |
应用领域:
- 经济学: 寡头垄断市场合作、国际贸易协定、公共物品供给(成本分摊)。
- 政治学: 议会中各政党联盟的形成与权力分配(夏普利-舒比克权力指数)。
- 运筹学/管理科学: 项目成本分摊(如机场跑道建设成本按飞机类型分摊)、供应链协同利润分配。
- 计算机科学/人工智能: 多智能体系统中的任务分配与收益共享、网络资源分配、联盟形成算法。
- 社会学: 社会网络中的合作行为分析。
总结:
合作博弈理论提供了一个强大的框架,用于分析当参与者能够形成有约束力的联盟时,如何最大化集体收益并解决收益分配的公平性和联盟稳定性问题。核心、夏普利值和核仁是理解不同分配原则的关键概念。它在经济学、政治学、管理学等多个领域有广泛的应用。
你想了解合作博弈中的某个特定方面(如核心、夏普利值的计算、应用案例)吗?
2025年LED显示屏市场畅想:在增长与博弈中寻找未来
2024年,中国LED显示屏行业以104.82亿元的出口额和2.22%的温和增长,交出了一份看似平稳的答卷。然而,数据背后暗流涌动:新兴市场的崛起与技术迭代的狂欢,与国内市场的内卷、全球供应链的博弈
2025-02-13 15:00:44
基于Logit动态的交通方式选择演化博弈模型
为了探究髙铁提速情况下用户岀行选择高铁和民航动态适应过程,基于效用理论构建岀行方式博弈收益矩阵,建立基于 Logit动态的交通方式选择演化博弈模型,并对模型的玶衡点和演化稳定性以及参数取值进行分析
资料下载
佚名
2021-04-15 10:36:41
移动目标信号博弈防御模型MTSGDM
从不对称的网络攻防实际情况岀发,分析网络攻防对抗具有的动态性、不完全信息性和多阶段性的特以信号博弈为框架,采用防御者为信号发起者,利用诱导信号干扰攻击的防御行为模式构建移动目标信号博弈防御模型
资料下载
佚名
2021-04-11 10:59:52
基于矩阵半张量积的时滞演化拥塞博弈镇定方法
针对带有时滞作用的演化拥塞博弈的镇定问题,提出一种基于半张量积的时滞演化拥塞博弈的镇定方法。利用矩阵的半张量积方法将时滞演化拥塞博弈描述为逻辑动
资料下载
佚名
2021-03-30 11:47:12
基于智能合约的三方博弈理性委托计算协议
大数据产业快速发展使得委托计算服务需求日趋增多,且委托计算效率在云计算支持下不断提高,然而传统委托计算协议需要验证计算结果,导致其计算效率降低。为此,提出一种基于智能合约的三方博弈理性委托计算协议
资料下载
佚名
2021-03-26 15:30:32
基于单点多步博弈的功防网络防御模型
当前复杂环境下网络安全问题频发,而现有攻防博弈网络防御模型未考虑网络攻击单点多步的特性,无法有效进行网络防御。针对网络攻防实际需求,通过模拟攻防环境和过程,提岀一种基于单点多步网络攻防博弈模型的防御
资料下载
佚名
2021-03-11 16:55:59
光合作用土壤呼吸综合测定系统
1970-01-01 08:00:00 至 1970-01-01 08:00:00
植物光合作用测量系统产品介绍
1970-01-01 08:00:00 至 1970-01-01 08:00:00
中美5G上的博弈也是华为与高通的博弈,美国已经掉队5G战场
中美5G上的博弈,也是华为与高通在营销上的博弈。终于,支持5G的iPhone 12系列千呼万唤始出来。但对于美国用户来讲,他们却无法享受到优质的5G体验。
2020-10-16 11:20:38
博弈论制胜数据中心
因此,我们开展了一系列项目,采用博弈论,即描述理性决策者之间策略互动的数学模型,来管理利己用户之间的资源分配,实现数据中心效率最大化。采用博弈论后,情况变得大为不同。
2020-07-14 10:03:54
为什么说比特币是博弈论的杰作
博弈论研究的是两个或多个参与者之间的战略互动过程,其中每个参与者的结果取决于所有参与者的行动。 博弈论- Osmo RauhalaIn实践,如果你是这样一个游戏的玩家,你必须考虑其他人的选择
2019-07-15 14:02:29
换一换
- 如何分清usb-c和type-c的区别
- 中国芯片现状怎样?芯片发展分析
- vga接口接线图及vga接口定义
- 芯片的工作原理是什么?
- 华为harmonyos是什么意思,看懂鸿蒙OS系统!
- ssd是什么意思
- 什么是蓝牙?它的主要作用是什么?
- 汽车电子包含哪些领域?
- TWS蓝牙耳机是什么意思?你真的了解吗
- 什么是单片机?有什么用?
- 升压电路图汇总解析
- plc的工作原理是什么?
- 再次免费公开一肖一吗
- 充电桩一般是如何收费的?有哪些收费标准?
- ADC是什么?高精度ADC是什么意思?
- EDA是什么?有什么作用?
- dtmb信号覆盖城市查询
- 中科院研发成功2nm光刻机
- 苹果手机哪几个支持无线充电的?
- type-c四根线接法图解
- 华为芯片为什么受制于美国?
- 怎样挑选路由器?
- 元宇宙概念股龙头一览
- 锂电池和铅酸电池哪个好?
- 什么是场效应管?它的作用是什么?
- 如何进行编码器的正确接线?接线方法介绍
- 虚短与虚断的概念介绍及区别
- 晶振的作用是什么?
- 大疆无人机的价格贵吗?大约在什么价位?
- 苹果nfc功能怎么复制门禁卡
- 单片机和嵌入式的区别是什么
- amoled屏幕和oled区别
- 复位电路的原理及作用
- BLDC电机技术分析
- dsp是什么意思?有什么作用?
- 苹果无线充电器怎么使用?
- iphone13promax电池容量是多少毫安
- 芯片的组成材料有什么
- 特斯拉充电桩充电是如何收费的?收费标准是什么?
- 直流电机驱动电路及原理图
- 传感器常见类型有哪些?
- 自举电路图
- 通讯隔离作用
- 苹果笔记本macbookpro18款与19款区别
- 新斯的指纹芯片供哪些客户
- 伺服电机是如何进行工作的?它的原理是什么?
- 无人机价钱多少?为什么说无人机烧钱?
- 以太网VPN技术概述
- 手机nfc功能打开好还是关闭好
- 十大公认音质好的无线蓝牙耳机