本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 : V1 L& n* y% ? X! Z. B
% u U' Q( o* L" E5 }: I; c严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! A: \, Q' }( }9 n# \4 _0 i 以下三个定义:
3 s' x9 c$ Y# i* k9 c' b 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + w5 j/ Y* `2 M( j
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 3 \& K- V8 \. _- ^0 s$ S$ B8 x
所谓的双方优势策略则是指双方利益总和最大的策略。
$ t$ V @% R6 x# A* n5 u' w[编辑本段]严格优势策略举例分析: W4 w0 g* B/ X" E1 j, J, E
一、经典的囚徒困境 % w* B) L9 [: b- {# l
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; O/ Z" a. ]/ M. @# U 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 R5 c6 N# P+ t5 t7 x- _ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( C, Q1 F: ^: F. e* E* r% U
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 x; X" G/ X5 O+ P) B 若二人都互相检举(互相“背叛”),则二人同样判监2年。 v/ g1 F# p8 A7 A. s( w) [' M
8 i# B& h7 s+ r- r# P! P; q用表格概述如下:
+ G" I3 t! n5 X: Y
+ u. b/ L' S8 k; o7 U) T 甲沉默(合作) 甲认罪(背叛)
O8 |4 F& `% t( Q乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
, W" }$ c0 {" @7 ~* u/ e2 q, ^乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + |' D# [1 T9 ]+ E
5 w& h" n d' j
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 " [) D1 c7 f$ r0 h
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + {- ]& [: b) m; m
若对方沉默、背叛会让我获释,所以会选择背叛。
) B n2 [2 L( {, a* M0 r 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" _+ O* i' X+ s3 R/ ~/ R 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 h: T: w' x+ m, V J* K% p) X/ d
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- e4 g9 k3 M" q8 Y" r8 z2 p5 w 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- S$ z: m u( j7 d[编辑本段]二、智猪博弈理论6 G% m4 p' o$ T/ Z7 H) H
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& E3 {+ f3 i2 y' _* }: v 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 - K) e d0 u9 ?
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 L/ k. k& w" J 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . i1 V$ E ^4 T; R( f7 y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + [% e( L. y: b6 p1 f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! r* Y5 o: @7 T5 t. ` 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 x2 k4 M/ f' C @& m 2 P( f/ o% ~/ s: l1 _! D
三、关于企业价格策略: k* R' O; q& D; _
& y; c1 h: u3 `' |5 O5 T 1 M j+ `% t: B2 b0 c% C; b
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" ?3 Q0 B9 P: Z; R F 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 x$ P! Z+ |) c% L) H7 N 以下三个定义:
6 ]8 h; S9 b M& H5 T" P4 l6 t 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ d" ?2 h% u; N7 y0 D 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% w& n$ N# p$ K2 B% F: } 所谓的双方优势策略则是指双方利益总和最大的策略。 % ]" g0 R7 P: D5 t7 O
[编辑本段]严格优势策略举例分析
2 ~6 M0 q! x* ?1 F- f 一、经典的囚徒困境
6 l5 P$ ~ C# U5 U/ l1 D3 T* F 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 G" H2 \$ B1 G3 B0 M
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) h" ^2 }, L; e8 ?$ `7 P) g; j
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 ?- }, i- L, E7 c3 m0 l. J
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) k' \* q8 c2 j g, j, s6 ?, T9 D
若二人都互相检举(互相“背叛”),则二人同样判监2年。
' J5 w. Z9 c1 ~" `# G$ G
' L* R1 q V7 G& M用表格概述如下: Z7 w" b$ @9 P( ^3 n/ c
/ a2 J8 o( F/ V! ?
甲沉默(合作) 甲认罪(背叛)
& W+ k7 M$ N% Q乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ c/ i0 ]$ [: [: E乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- e2 \" |# S0 |+ u& a8 i9 M: V+ j) U7 {8 r+ x* @. x: b* w3 ^; {
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% Z+ G: K- E; a 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 G% X: W' j( |# V 若对方沉默、背叛会让我获释,所以会选择背叛。
8 y; R8 q5 D* @( { 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) V$ z( A4 z/ B7 A+ ]1 D" p9 ?% G 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - B9 m3 V8 k* C: S$ L5 i
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! K: x4 i" D" B
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. q; U' J% b8 M( b0 H[编辑本段]二、智猪博弈理论
" c8 e9 a$ T0 ?( P. r: Z9 L" Z3 z R 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 `; f( f' E: t" Y
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & ?" @9 Z# ]3 F
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 N& z k0 V* Y! B3 _0 J 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 z9 }0 i( S: U9 Q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. e& w# Q2 ~) G# W7 B% F 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 \! T4 R, l% O( Z; V6 j
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" s- [ R; G0 ?
" s' J5 Z L# C7 Q% c1 \
三、关于企业价格策略1 [: X7 F" B7 c, M1 e6 ^
2 P2 h. N- ~$ w 1 t. U% h# P: M2 ` |) Q: A4 Z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 X1 u; u6 e2 K, y4 U5 {9 b5 x
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; _# F1 e- C1 E. o% l* m: g3 ]$ R
以下三个定义:
4 x6 Y( q2 D3 n6 S 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 U1 ?( D* T& P 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 `9 S1 R1 R) r1 x 所谓的双方优势策略则是指双方利益总和最大的策略。 2 y: g1 \& U0 e, V% h0 n8 X8 n
[编辑本段]严格优势策略举例分析
$ t& k* l& L1 [ 一、经典的囚徒困境
: _0 \0 X8 t7 w* L; E 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 _9 a8 T1 Q! j 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 W9 j3 d1 ?; L y* u) U$ k R
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% i2 h; s$ J2 w' H$ s+ E& f1 o 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ S8 X. n Z% `1 m: Z 若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 K9 _2 V% e+ u
) F9 k: m. ^2 ~, ?) ^用表格概述如下:
$ }5 w' F' g' h
3 q! K0 @! l, N8 J7 U3 n n. m$ S 甲沉默(合作) 甲认罪(背叛)
. b* i8 s4 V) p4 ?! r) w) G乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" I6 t7 e& I1 n- F: b0 T: R乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
' D6 z6 a- J4 @. |( d' }
6 ~$ K; u2 k, P- E" e( m/ b ^ H 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! c2 p: s4 ]& K- N4 k+ j6 m/ B$ ] 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 Q! d2 z) O2 X5 u+ { 若对方沉默、背叛会让我获释,所以会选择背叛。 ) @) o! c9 h- ~2 y7 H
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' x n$ c2 s4 c0 W+ _, f8 d
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 F0 u) o+ S9 s" d4 @2 V+ T 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 `* Q3 W( M% F4 K
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- I7 A; f6 o6 z. O+ n0 L( p
[编辑本段]二、智猪博弈理论
5 ^' L* a* T4 q& v, p 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& H6 h L9 c) v. S2 W% t/ L 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 {: `% I5 C) | I3 f1 [3 t" e
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: A4 l% W; w+ c 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ O6 ~ Z* ]' W4 I6 ~3 R
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* S1 Y- B+ j4 u 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + X: G0 z5 y- p
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 l3 a: J _# }+ f( {8 ?/ x$ X5 |) k
6 N9 {8 V* S3 G s0 s) {三、关于企业价格策略0 A- x6 s/ z; G, O
/ x6 `8 {, a* z$ b
2 H" M2 P- D! W1 \8 X, X3 F. |
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; N0 Y7 k1 }' Q w! f$ e& }9 V
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ C- R, `9 ]. n! F8 q6 @& e* T: Y 以下三个定义:
+ @% u$ n6 ?/ P 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% U- b+ S: l/ h3 S* c 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ o; S5 t W0 c. v. a 所谓的双方优势策略则是指双方利益总和最大的策略。 ! \1 ]) n4 Z: r
[编辑本段]严格优势策略举例分析; Q6 ?5 X+ T# O6 ~9 U( A9 q7 D
一、经典的囚徒困境
9 D' D9 m/ @5 J/ z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 l9 m; v( b: d 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' ~2 L8 i, m D
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & l) y4 M7 _2 u4 c
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . p8 N5 S$ T4 ^( z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
) _! T. z( ~0 |- |' C# j4 V$ R
" B1 b& Z# r2 [; U- U% A用表格概述如下:' @* I, S3 ]: J: r6 O2 [" W- V
% ~9 M, p7 a, `0 i+ q W/ D* B* X
甲沉默(合作) 甲认罪(背叛) ; g, E/ {, w. g' H, ^( f0 p. d
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* ?. W1 [7 K. M* I8 S$ s0 {9 q乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 2 r0 i/ Z/ I; S/ k
5 \! b7 c5 ~: V& O5 H3 y; Z$ G' j
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 m6 {( ]8 n8 {" \ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: v; z8 }9 e* l( B! I: J' F 若对方沉默、背叛会让我获释,所以会选择背叛。
' e! s2 r2 n+ o0 {8 B' n 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; s2 q8 g: ?7 n
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * G. X; W/ R$ O7 h/ S
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 ]& L' u0 y+ y! U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 V& ^6 S& ^' x' |1 S[编辑本段]二、智猪博弈理论
( Y( G! C. m6 K+ I 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 c. F+ v8 C* W 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& B! o* l' ^% x# y2 |" {' X: m 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 h3 ] J9 l5 ?/ i& S. ` 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 s4 B0 [/ c. b “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) h6 [# s: a7 s' w
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; N- b5 N) B/ t+ w9 f! Y 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* w5 ~2 j# ]' B4 X, h9 Q6 H: q " @2 {% ~+ i; b5 L! O7 x
三、关于企业价格策略
! R: O( w8 N/ F5 G
2 t8 K/ k" ^, { c& g8 g( C, q6 t
7 V& T3 W8 s9 t9 A) i 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( ]; @$ G5 Z/ C" D4 A
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |