博弈论简介
博弈论(game theory)是经济学的一个分支,主要研究具有竞争或对抗性质的个体,在特定规则下所产生的各种行为.博弈论关注博弈中个体的预期行为与实际行为,并研究其最优策略.
通俗地讲,博弈论主要研究的是:在一个游戏中,进行游戏的多位玩家如何选择策略.
基础概念
本节将简要介绍博弈论中的一些常见概念.
合作/非合作博弈
合作博弈(cooperative game)是指参与者可以结成联盟、相互合作的博弈.在这类博弈中,个体的不合作行为往往会受到某种外部机制的惩罚.与之相对,非合作博弈(noncooperative game)中并不存在这样的机制,因此,参与者要么无法结成联盟,要么只能依赖可信的威胁机制维持合作.
相比合作博弈,非合作博弈的研究更为系统和成熟.本文讨论的所有博弈均为非合作博弈.
对称/非对称博弈
在 对称博弈(symmetric game)中,不同参与者在做出相同行为时获得的收益是相同的,也就是说,收益只取决于行为本身,而与行为者的身份无关.不满足这一条件的博弈称为 非对称博弈(asymmetric game).
零和/非零和博弈
主页面:零和博弈
零和博弈(zero-sum game)指的是无论各方采取何种行为,所有参与者的收益总和始终为零.通常讨论的零和博弈涉及两名参与者,此时,一方的收益必然是另一方的损失.相对地,非零和博弈(non-zero-sum game)允许多方共赢或共输,包括 正和博弈(positive-sum game)和 负和博弈(negative-sum game)等.
同时/序贯博弈
在 同时博弈(simulatenous game)中,所有参与者在不知道他人选择的前提下同时做出决策.例如剪刀石头布就是一个典型的同时博弈.这类博弈常用收益矩阵表示,并通常不涉及时间的概念.
与此相对的是 序贯博弈(sequential game),即参与者依次行动.需要注意的是,后行动者至少能够观察到部分先行动者的行为,否则先后顺序将毫无意义.序贯博弈通常借助博弈树来刻画.
完美/不完美信息博弈
完美信息(perfect information)指参与者在任意时刻做出决策时,完全了解此前所有事件的发生情况,包括游戏初始状态.例如象棋、围棋等属于完美信息博弈;而麻将、扑克则是不完美信息博弈,因为玩家无法获知他人的手牌.完美信息通常用于描述序贯博弈;由于在同时博弈中玩家彼此无法得知对方即将采取的行动,因此通常认为同时博弈不是完美信息博弈.
完全/不完全信息博弈
完全信息(complete information)是指所有参与者对博弈结构本身(包括各方可选决策和最终收益)有完全了解,且这些信息为公共知识(common knowledge).与之相对的是不完全信息博弈,其中某些博弈要素(如对手的可选决策或收益函数)对参与者来说是未知的.
值得注意的是,「完全信息」和「完美信息」是两个独立概念,互不包含.例如,麻将是一种完全信息但不完美信息的博弈,因其规则和收益是公开的,但牌面信息并不透明;而某些具有隐藏目标、但行为全程公开的游戏,则属于完美信息但不完全信息的博弈.
组合博弈论
在算法竞赛中,最常见的博弈类型是 组合博弈(combinatorial game).该术语通常指那些因状态数量巨大而难以求解的博弈.正因为一般的组合博弈相当复杂,组合博弈论主要关注以下类型:两人轮流行动的、完美信息、无随机因素的博弈.象棋、围棋等都是典型的组合博弈.
公平组合博弈
主页面:公平组合博弈
公平博弈(impartial game)指满足如下条件的组合博弈:
- 在任意确定状态下,所有参与者可选择的行动完全相同,仅取决于当前状态,与身份无关;
- 博弈中的同一个状态不可能多次抵达,博弈以参与者无法行动为结束,且博弈一定会在有限步后以非平局结束.
公平博弈总是对称博弈.
非公平组合博弈
主页面:非公平组合博弈
与公平博弈相对的概念是 非公平博弈(partizan game),即参与者在某一状态下可采取的行动依赖其身份.大多数棋类游戏(如国际象棋、中国象棋、围棋、五子棋等)都是非公平博弈,因为参与者只能操作自己的棋子.
正常/反常博弈
组合博弈中,通常的胜利者是博弈结束前,最后一名采取行动的参与者.这称为 正常博弈(normal game).与之相对应的是 反常博弈(misère game),即博弈结束前,最后一名采取行动的参与者是失败者.
公平和非公平组合博弈都可以是正常或反常博弈.
参考资料
- Game theory - Wikipedia
- Combinatorial game theory - Wikipedia
- Impartial game - Wikipedia
- Misère - Wikipedia
本页面最近更新:2026/1/7 08:56:54,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:c-forrest, Backl1ght, Tiphereth-A, woruo27, cutekibry
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用