本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 5 o- f" P5 M) F) m x
R! x- |- f) u4 ~; K严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. p& n" A6 g K2 x
以下三个定义:1 H& I5 W ^* D q4 I
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 B9 l0 r5 p; F9 q4 F
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- i& R5 @- G4 D& o 所谓的双方优势策略则是指双方利益总和最大的策略。 . v1 G% a- `& v- B
[编辑本段]严格优势策略举例分析/ g, q6 I8 I* e( @9 x, M& l
一、经典的囚徒困境 & H. T/ Y( d: e
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; X+ w, y: h+ M3 k1 S/ _" d8 ]- u 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 I# v2 Q$ ?( T% X6 D, u 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - Z# d! r+ y# } x
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 Q2 K% L$ z& S% P
若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 L, J; s+ u& J7 p9 x) W2 p9 T
& X2 X" x- B1 D* {# f" j用表格概述如下:8 h+ f1 U, r0 ~7 ?6 L/ V
/ a% {7 d1 U, I% Q3 A$ S2 O 甲沉默(合作) 甲认罪(背叛) ' U( t# Y9 e1 b0 j! `% V
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ D5 m u- \/ C- ~- }8 t乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* v& I' m$ O# _
: Y% m% J9 s, T% Z6 v 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! y9 T8 U8 u9 K' H0 I$ M 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 9 P& K6 ~. T% E
若对方沉默、背叛会让我获释,所以会选择背叛。
. L, ], C& n; o" y* ]4 Q3 Q1 U 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 - F) B6 a" x) P3 t! S% ^
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . K* ?0 k; A0 w# v, l
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
' ^# R0 ~7 S% c4 H5 ]% w# M& u$ F 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。& L+ y: h/ _- D5 J, s
[编辑本段]二、智猪博弈理论, G W6 s0 L- f5 C/ V& j+ ?8 a
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 ?7 Z- s! X% ~3 M4 Q1 x. A 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
6 ]; J$ h. e; ?' }, k6 s- l4 R) q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " q6 [9 s, [2 q+ |
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( J* k# q& P9 v# D1 i& h' y “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! l2 e7 s( m/ W3 F4 J 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
# J i+ i) N: {4 r 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, D" h n8 [7 Y% U% x
* L: t ~' J. G. d3 T7 I3 F5 A三、关于企业价格策略* l7 ], C* F( ~9 d* }; }/ D m
0 @. m# a3 r1 u$ Y3 M & F* U" a7 k- V. Z1 ?
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" t+ m9 e, g* ^' i* k& {/ E2 R 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 N1 o3 n/ D# w 以下三个定义:
7 d% Y% D! k1 L8 j6 u* M T1 j9 k 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- K* E- J) b5 G: s" ]6 T; ? 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 c. e: C9 }4 s6 E! C
所谓的双方优势策略则是指双方利益总和最大的策略。 % X$ u8 F9 I- Z" r" [* d' b
[编辑本段]严格优势策略举例分析' P2 j5 c% L3 C( `+ e" H* x. ?
一、经典的囚徒困境
8 u% o) r: J3 O1 j9 Y! C- ?" ]% A& j6 v 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 _& ^8 U6 d0 E. U6 X% \6 L6 ~
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 5 K5 q! Z$ ^0 N% s* Q1 I
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; E5 }9 d* @/ U1 g1 |! W2 x
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : ^% c8 t& W1 }; f4 K( `# V# R' D; f
若二人都互相检举(互相“背叛”),则二人同样判监2年。+ _/ J2 n) I( y7 h4 x& E
: ?, M4 Y# y3 u" |8 W
用表格概述如下:5 `* Z$ p7 L+ z4 D. b4 @, t
4 k; ]4 I5 K3 P% E( ?
甲沉默(合作) 甲认罪(背叛) 2 N$ @) G2 }9 I
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 6 G: u6 x' s C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ( P8 M s' r& B2 J
4 t, k0 z* h- G8 |% @/ N
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! [& C' S1 u7 J
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : @( h8 d5 c) H
若对方沉默、背叛会让我获释,所以会选择背叛。 $ I% |* F& {# ` Q% Q
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + O8 O( R6 {( J0 k5 k
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. N" @5 b, B: w3 Y4 q( P 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; _4 n& l" v4 G 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- p! T8 a5 ]$ Z/ u
[编辑本段]二、智猪博弈理论: v9 z# C' m& E: }# b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- d* i' K4 `! s. I& v3 O 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * {$ f- T& ~% G6 W
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & J' n2 Z/ L' S' P& M
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ @, Y' n3 R5 _. }" R “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - y* z$ h- ^4 ~" }
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) s* t. C8 w) X/ p" U- l$ l0 F# |1 _" \
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 q( \& M" S" \2 I
9 \: v8 g1 ]$ N7 Y* `# s
三、关于企业价格策略7 m8 s/ N. g# {3 j/ Z
0 e2 e6 f) r; G& E# [
4 `3 E- ]9 J+ n; l# }4 i. F 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: F& R3 r7 ^9 K% O- H 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- C& M, }" B4 ^. b+ a& v 以下三个定义:8 Z2 W/ ^- L6 ?- X0 i* j9 Q c
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 i$ \5 M2 J% w( ~: w( C& ^
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 o C) l2 Q: K# _6 Z 所谓的双方优势策略则是指双方利益总和最大的策略。 * E6 ~, N8 M# y6 n+ c
[编辑本段]严格优势策略举例分析
9 F# [' n+ X% |# v 一、经典的囚徒困境
3 M& d& m( E" N$ G% P 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# q- r" q5 i' o7 N+ ^* R- f 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 E& ^7 ]" ]# w4 n6 @" } 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 h# a6 a: L6 |5 H. \- k 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 ^# o3 A6 p0 [5 j, _8 u* Z$ q$ I 若二人都互相检举(互相“背叛”),则二人同样判监2年。5 t& T" p+ K& t. `1 T6 W+ ^/ D
. N' M0 [( R# Y2 C
用表格概述如下:
. b0 h( q( Q2 b1 U
2 v9 M5 C4 j: J! i4 [ 甲沉默(合作) 甲认罪(背叛)
* ^0 R8 {7 Y! Z" \乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - R# _" S* H! J3 {% {& E
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# A7 M; J6 i( _) J+ c$ e3 t: y9 Q0 S: o7 s
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! U. r# C8 {) A' i4 B8 H1 P
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* a7 n1 f A' P- k) m) a5 w( R5 y4 U 若对方沉默、背叛会让我获释,所以会选择背叛。 . E5 q! n/ J& A
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( w4 W5 f4 z2 X( n 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* h# U4 b( z. O9 U0 I 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, D% X! M1 q; n0 r' Y2 C 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。: R& f- M9 H5 u' C% a3 J5 Y
[编辑本段]二、智猪博弈理论" I" E. D+ K5 L8 j- o' a
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & T% V) r$ Y' p3 {% e0 s
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , M+ d; d) _/ n$ Q
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 K8 D C+ `! C- f5 s
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ n4 c0 Y) s& n8 j
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' f( G1 Q( W% T% a% j# ^
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " M: y4 q' E! ~
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 O4 |( X& g. m
( A; u0 v" u' d/ x
三、关于企业价格策略
3 H4 d' y8 K1 A- f8 U2 k* g# t- y1 @, a5 {" V: ?
+ @1 p2 z6 _. s 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: c. H! a9 _- b# H# d 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" r4 _7 j# T. m, M
以下三个定义:; w* k# g8 P4 }# V
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( n+ y+ X; }6 u O7 L( [$ n 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& I- _ t! o: x, ^0 T0 \. Y 所谓的双方优势策略则是指双方利益总和最大的策略。
, ]9 U% [9 v& n a8 Z[编辑本段]严格优势策略举例分析5 u+ |) i$ v* F; F5 |4 q# J
一、经典的囚徒困境 # d* v' V2 }" Z3 m* f7 o. }
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 K( y) J) |- j: R) W, a3 y 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( S' _ x0 u ~3 _0 S8 y
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 c6 y) o# s5 p5 ^0 x- r* D% h
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) J4 R4 {1 n( S; v; {0 U( [; a7 r 若二人都互相检举(互相“背叛”),则二人同样判监2年。
, f# N) v/ f( g2 K3 T6 M ! s6 `% C! @( w/ f6 |0 Y+ H
用表格概述如下:
, I$ v# m) p) e$ ^: f2 D4 g4 \! @, R+ [/ z
甲沉默(合作) 甲认罪(背叛) ( p* l$ O2 _/ T& i4 M- j1 d: V
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 7 ]* i- C+ Y+ n' {
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
6 Y6 i! k7 F& t7 c9 @ Y
$ N. I' b4 m* W3 w- o6 | 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! m' F) \- F5 E" I# J' ?- f 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 @/ k& ?4 N' x: ~( J9 [ 若对方沉默、背叛会让我获释,所以会选择背叛。 & E& ~5 v& K7 ^( \9 k1 X1 K
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ H; Y3 W2 O9 B: ^" S 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # |9 V1 y% N$ |8 v9 D
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ' O; W# j% }6 T& D% V* ^. ^; l
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ W5 \3 j& y K% @& z- h; L3 l9 c
[编辑本段]二、智猪博弈理论
0 D7 E, Y! t% [+ H$ l0 s 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & l8 C; U/ h( w7 \- X+ t( M
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' Z+ P6 [# } K* C3 ?1 U
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : O p: Q ]* T
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . ^- X X% \: y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- [; n+ I% P) ~0 v3 G 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* K9 F7 K" [, w& v! w 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 U. U2 S5 `' r! F8 U, S3 ~ 8 z1 U' P6 s2 W: [
三、关于企业价格策略
$ c% J) m4 T3 y! z5 c3 |
4 j+ B9 l1 _* v. V `6 F, u1 n3 F
1 T# k# H& \+ r! i0 A1 w9 M 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ z# Z' ]) n! _" i 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |