关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 : V1 L& n* y% ?  X! Z. B

% u  U' Q( o* L" E5 }: I; c严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! A: \, Q' }( }9 n# \4 _0 i  以下三个定义:
3 s' x9 c$ Y# i* k9 c' b  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + w5 j/ Y* `2 M( j
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 3 \& K- V8 \. _- ^0 s$ S$ B8 x
  所谓的双方优势策略则是指双方利益总和最大的策略。  
$ t$ V  @% R6 x# A* n5 u' w[编辑本段]严格优势策略举例分析: W4 w0 g* B/ X" E1 j, J, E
  一、经典的囚徒困境 % w* B) L9 [: b- {# l
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; O/ Z" a. ]/ M. @# U  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 R5 c6 N# P+ t5 t7 x- _  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( C, Q1 F: ^: F. e* E* r% U
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 x; X" G/ X5 O+ P) B  若二人都互相检举(互相“背叛”),则二人同样判监2年。  v/ g1 F# p8 A7 A. s( w) [' M
  
8 i# B& h7 s+ r- r# P! P; q用表格概述如下:
+ G" I3 t! n5 X: Y
+ u. b/ L' S8 k; o7 U) T    甲沉默(合作)  甲认罪(背叛)  
  O8 |4 F& `% t( Q乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
, W" }$ c0 {" @7 ~* u/ e2 q, ^乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  + |' D# [1 T9 ]+ E
5 w& h" n  d' j
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 " [) D1 c7 f$ r0 h
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + {- ]& [: b) m; m
  若对方沉默、背叛会让我获释,所以会选择背叛。
) B  n2 [2 L( {, a* M0 r  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" _+ O* i' X+ s3 R/ ~/ R  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 h: T: w' x+ m, V  J* K% p) X/ d
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- e4 g9 k3 M" q8 Y" r8 z2 p5 w  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- S$ z: m  u( j7 d[编辑本段]二、智猪博弈理论6 G% m4 p' o$ T/ Z7 H) H
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& E3 {+ f3 i2 y' _* }: v  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 - K) e  d0 u9 ?
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 L/ k. k& w" J  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . i1 V$ E  ^4 T; R( f7 y
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + [% e( L. y: b6 p1 f
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! r* Y5 o: @7 T5 t. `  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 x2 k4 M/ f' C  @& m  2 P( f/ o% ~/ s: l1 _! D
三、关于企业价格策略: k* R' O; q& D; _

& y; c1 h: u3 `' |5 O5 T  1 M  j+ `% t: B2 b0 c% C; b
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" ?3 Q0 B9 P: Z; R  F  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 x$ P! Z+ |) c% L) H7 N  以下三个定义:
6 ]8 h; S9 b  M& H5 T" P4 l6 t  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ d" ?2 h% u; N7 y0 D  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% w& n$ N# p$ K2 B% F: }  所谓的双方优势策略则是指双方利益总和最大的策略。  % ]" g0 R7 P: D5 t7 O
[编辑本段]严格优势策略举例分析
2 ~6 M0 q! x* ?1 F- f  一、经典的囚徒困境
6 l5 P$ ~  C# U5 U/ l1 D3 T* F  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 G" H2 \$ B1 G3 B0 M
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) h" ^2 }, L; e8 ?$ `7 P) g; j
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 ?- }, i- L, E7 c3 m0 l. J
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) k' \* q8 c2 j  g, j, s6 ?, T9 D
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
' J5 w. Z9 c1 ~" `# G$ G  
' L* R1 q  V7 G& M用表格概述如下:  Z7 w" b$ @9 P( ^3 n/ c
/ a2 J8 o( F/ V! ?
    甲沉默(合作)  甲认罪(背叛)  
& W+ k7 M$ N% Q乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
/ c/ i0 ]$ [: [: E乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
- e2 \" |# S0 |+ u& a8 i9 M: V+ j) U7 {8 r+ x* @. x: b* w3 ^; {
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% Z+ G: K- E; a  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 G% X: W' j( |# V  若对方沉默、背叛会让我获释,所以会选择背叛。
8 y; R8 q5 D* @( {  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) V$ z( A4 z/ B7 A+ ]1 D" p9 ?% G  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - B9 m3 V8 k* C: S$ L5 i
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! K: x4 i" D" B
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. q; U' J% b8 M( b0 H[编辑本段]二、智猪博弈理论
" c8 e9 a$ T0 ?( P. r: Z9 L" Z3 z  R  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 `; f( f' E: t" Y
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & ?" @9 Z# ]3 F
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 N& z  k0 V* Y! B3 _0 J  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 z9 }0 i( S: U9 Q
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. e& w# Q2 ~) G# W7 B% F  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。   \! T4 R, l% O( Z; V6 j
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" s- [  R; G0 ?
  " s' J5 Z  L# C7 Q% c1 \
三、关于企业价格策略1 [: X7 F" B7 c, M1 e6 ^

2 P2 h. N- ~$ w  1 t. U% h# P: M2 `  |) Q: A4 Z
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 X1 u; u6 e2 K, y4 U5 {9 b5 x
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; _# F1 e- C1 E. o% l* m: g3 ]$ R
  以下三个定义:
4 x6 Y( q2 D3 n6 S  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 U1 ?( D* T& P  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 `9 S1 R1 R) r1 x  所谓的双方优势策略则是指双方利益总和最大的策略。  2 y: g1 \& U0 e, V% h0 n8 X8 n
[编辑本段]严格优势策略举例分析
$ t& k* l& L1 [  一、经典的囚徒困境
: _0 \0 X8 t7 w* L; E  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 _9 a8 T1 Q! j  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 W9 j3 d1 ?; L  y* u) U$ k  R
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% i2 h; s$ J2 w' H$ s+ E& f1 o  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ S8 X. n  Z% `1 m: Z  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 K9 _2 V% e+ u  
) F9 k: m. ^2 ~, ?) ^用表格概述如下:
$ }5 w' F' g' h
3 q! K0 @! l, N8 J7 U3 n  n. m$ S    甲沉默(合作)  甲认罪(背叛)  
. b* i8 s4 V) p4 ?! r) w) G乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
" I6 t7 e& I1 n- F: b0 T: R乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
' D6 z6 a- J4 @. |( d' }
6 ~$ K; u2 k, P- E" e( m/ b  ^  H  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! c2 p: s4 ]& K- N4 k+ j6 m/ B$ ]  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 Q! d2 z) O2 X5 u+ {  若对方沉默、背叛会让我获释,所以会选择背叛。 ) @) o! c9 h- ~2 y7 H
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' x  n$ c2 s4 c0 W+ _, f8 d
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 F0 u) o+ S9 s" d4 @2 V+ T  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 `* Q3 W( M% F4 K
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- I7 A; f6 o6 z. O+ n0 L( p
[编辑本段]二、智猪博弈理论
5 ^' L* a* T4 q& v, p  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& H6 h  L9 c) v. S2 W% t/ L  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。   {: `% I5 C) |  I3 f1 [3 t" e
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: A4 l% W; w+ c  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ O6 ~  Z* ]' W4 I6 ~3 R
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* S1 Y- B+ j4 u  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + X: G0 z5 y- p
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 l3 a: J  _# }+ f( {8 ?/ x$ X5 |) k  
6 N9 {8 V* S3 G  s0 s) {三、关于企业价格策略0 A- x6 s/ z; G, O
/ x6 `8 {, a* z$ b
  2 H" M2 P- D! W1 \8 X, X3 F. |
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; N0 Y7 k1 }' Q  w! f$ e& }9 V
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ C- R, `9 ]. n! F8 q6 @& e* T: Y  以下三个定义:
+ @% u$ n6 ?/ P  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% U- b+ S: l/ h3 S* c  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ o; S5 t  W0 c. v. a  所谓的双方优势策略则是指双方利益总和最大的策略。  ! \1 ]) n4 Z: r
[编辑本段]严格优势策略举例分析; Q6 ?5 X+ T# O6 ~9 U( A9 q7 D
  一、经典的囚徒困境
9 D' D9 m/ @5 J/ z  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 l9 m; v( b: d  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' ~2 L8 i, m  D
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & l) y4 M7 _2 u4 c
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . p8 N5 S$ T4 ^( z
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
) _! T. z( ~0 |- |' C# j4 V$ R  
" B1 b& Z# r2 [; U- U% A用表格概述如下:' @* I, S3 ]: J: r6 O2 [" W- V
% ~9 M, p7 a, `0 i+ q  W/ D* B* X
    甲沉默(合作)  甲认罪(背叛)  ; g, E/ {, w. g' H, ^( f0 p. d
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
* ?. W1 [7 K. M* I8 S$ s0 {9 q乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  2 r0 i/ Z/ I; S/ k
5 \! b7 c5 ~: V& O5 H3 y; Z$ G' j
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 m6 {( ]8 n8 {" \  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: v; z8 }9 e* l( B! I: J' F  若对方沉默、背叛会让我获释,所以会选择背叛。
' e! s2 r2 n+ o0 {8 B' n  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; s2 q8 g: ?7 n
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * G. X; W/ R$ O7 h/ S
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 ]& L' u0 y+ y! U
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 V& ^6 S& ^' x' |1 S[编辑本段]二、智猪博弈理论
( Y( G! C. m6 K+ I  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 c. F+ v8 C* W  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& B! o* l' ^% x# y2 |" {' X: m  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 h3 ]  J9 l5 ?/ i& S. `  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 s4 B0 [/ c. b  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) h6 [# s: a7 s' w
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; N- b5 N) B/ t+ w9 f! Y  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* w5 ~2 j# ]' B4 X, h9 Q6 H: q  " @2 {% ~+ i; b5 L! O7 x
三、关于企业价格策略
! R: O( w8 N/ F5 G
2 t8 K/ k" ^, {  c& g8 g( C, q6 t  
7 V& T3 W8 s9 t9 A) i  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( ]; @$ G5 Z/ C" D4 A
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )