[H22] 決策理論

人生在世總難免要做決策或決定。早上吃雙腸蛋還是肉丁米粉?應安坐家中抑或上街遊行?該與A君還是與B君結婚?重返校園還是繼續在社會打滾? 這等問題都是我們日復日要面對的決策問題。有些決策做錯了並無傷大雅。比方說,你選了部爛片觀看而白白浪費了整個下午也許會令你很氣憤,但卻不會對你的人生做成多大損失。然而,在某些事情做錯了決策卻可能會令你抱憾終生,甚至萬劫不復。譬如說,錯誤投資而輸了整副家財就可能會令你妻離子散。

如何作理性的決策構成決策理論的中心課題。較精確地說,決策理論是一門研究決策者在不同處境下該如何選擇才最 為理性的學問。決策論與游戲理論皆為研究決策的學問,兩者的主要不同在於前者只研究個人的決策;後者則考慮涉及多於一人的決策情境。

必需指出一點,決策理論只能告訴你怎樣做決策最理性,並不能擔保你每次也能獲得好結果。最理性的決策未必會導至最好 的結果。最好的結果也不一定來自最理性的決策。簡言之,理性的決策與結果的好壞並無必然聯系。畢竟,結果的好壞總難免摻雜運氣的因素。

當代的決策理論已被發展成一高度技術性的學科(通常被視作應用數學的一分支)。本導修課將避開所有技術細節,只對此理論作簡要的介紹。

典型的決策情境涉及決策者面對兩個或以上的相互排斥的選擇 (所謂「相互排斥」的選擇,即不可能同時並存的選擇。) 。決策論者通常把決策情境分為以下三類:

  1. 風險下的決策情境
  2. 不確定性下的決策情境
  3. 不確定性下的決策情境

讓我們首先考慮第一類處境。

§1. 風險下的決策情境

每個行動通常也能引發若干可能後果。當決策者能評估可選擇的每個行動的各個可能後果發生的機率時,我們稱他面對的處境為「風險下的決策情境」。以下情境便為一例:小強眼疾日深而漸趨失 明。醫生對他說,接受移殖眼角膜手術將可能改善他的視力。但手術並非無風險 —— 手術成功的機會只有0.7。若手術失敗,他視力更壞的機率為0.1,維持手術前的視力水平的機率為0.2。假設小強若不做手術,他的視力將維持原狀。小 強面對的決策情境將可以下圖表示:

行動

行動的可能後果

視力有改善 視力維持原狀 視力更壞

1.做手術

0.7

0.2

0.1

2.不做手術

0

1

0

再舉一個例子。小白正考慮選擇以下哪一種賭博 游戲對他最有利。(一) 公字 :若投擲的貨幣表面是公,他則贏取10元,若為字,則不能贏取分毫 (假設貨幣為一公平的銅幣,故此出現公或字的機會各為0.5。 。(二) 骰子 :莊家每次擲出兩枚骰子,若兩枚骰子點數相同,他則贏得十元,若否,則分毫也不能獲得。(我們從簡單的機率計算得知,兩枚骰子點數相同的機率約為0.167,點數不同的機率約為0. 833) 讓我們假設小白的賭博本金為5元。面對的決策情境將可以下圖表示:

行動

行動的可能後果

贏得0元

贏得10元

1. 公字

0.5

0.5

2. 骰子

0.833

0.167

在這些情境下我們該選擇哪一行動才最理性?決策論者認為以下規則雖非毫無瑕疵,在一般情形下提供我們合理的指示:

最大化期望值或稱期望效用原則: 決策者應選取能給予他最大期望值的行動。

假設 決策者面前有N個行動選擇。根据此原則,決策者應計算每個行動分別對應的期 望值,然後選擇期望值最高的行動而行。涉及金錢的處境最易說明此原則之應用。以例二為例,行動1及2分別對應的期望值及其計算方法如下所示:

行動

期望值

1. 公字

(0.5 x 0) + (0.5 x 10) - 5 = 0

2. 骰子

(0.833 x 0) + (0.167 x 10) -5 = -3.33

因此,最大化期望值原則告訴我們應選行動1而行。

當回報並非為明顯可量化的事項 (如金錢)時,應用此原則將較麻煩。 例如在例一中我們不能像例二般把金 錢直接轉換成期望值, 要計算做手術與不做手術的期望值則須略花心思。以下為一可能建議:我們可替聯系行動1及2的可能後果各指派一個值,如下:

行動1:

視力 有改善 (10),視力維持原狀 (-2),及視力更壞 (-10)

行動2:

視力 維持原狀 (0)

行動1的期望值 = (10 x 0.7) + (-2 x 0.2 )+ (-10 x 0.1) = 5.6

行動2的期望值 = 0 x 1 = 0

§2. 確定性下的決策情境

在某些情況下,決策者能選擇的行動每個也只有一個可能後果。這種情況稱作確定性下的決策情境。下面就為一例:

行動

行動的可能後果

1 在家寫論文

在家寫論文

2 在圖書館寫論文

在圖書館寫論文

若你選擇行動1,這行動的可能後果就是你在家寫論文;若選擇行動2,這行動的可能後果就是你在圖書館寫論文。

嚴格而言,世上根本不存在上述的決策情境。在你決定行動那刻 到履行行動之間,世事已可能以你難以預料的方式改變。例如說,經過一輪考慮後,你決定到圖書館完成那惱人的論文。然而,到達圖書館 之時卻發現館內因停電而閉館。畢竟,世事變幻莫測,確定性也許只是幻象。

既然在這種決策情境下行動的可能後果只有一個,顯然我們並不需為計算期望值而費神。那麼,在這情況下該以什麼作為行動 的准則?答案明顯得很 —— 比較各行動後果的效用而選具效用最高者而行。 比方,若你認為在家寫論文的效用不及在圖書館,那你則應擇行 動2而棄行動1。

然而,比較行動後果 效用並非總是易事。比方說你正考慮該購買愉翠苑還是錦豐苑的單位。你該如何比較兩者的效用?比較首期 及月供之金額故然應列入考慮因素。然而,除此之外,你也許需考慮其他與金錢無關之事。例如,哪屋苑治安較佳?錦豐苑交通是否較方 便? 愉翠苑的樓宇是否穩固 (早前曾發生短樁事件。兩者中衛生設備何者較佳? 比較效用往往因需慮及這等因素而變 得複雜棘手。

§3. 不確定性下的決策

決策者有時可能對可供選擇的行動之後果的發生機率一無所知。這種情境稱作「不確定性下的決策情境」。

亳無疑問,這種情況甚為罕見。在大多數情況下,我們也能粗略 評估不同可能後果發生的機率。股票投資也許為最符合這種不確定情境之例 (至少就非專業的投資者而言。故我們不妨以此投資對此情境作說明。

假設股壇新秀方 展博正欲在股場一試身手。在他腦海正盤算著四種投資策略:(1)投資$8,000,(2)投資$4,000, (3)投資$2,000,及(4)投資$1,000。方先生雖能預計各個投資策略的可能結果,卻 無能評估它們發生的可能性。下面回報表表示他的決策情境:

行動

行動的可能後果

 

牛市

普通市

熊市

$8000

$800

$200

-$400

$4000

$400

$100

-$200

$2000

$200

$50

-$100

$1000

$100

$25

-$50

方先生應選擇何種投資策略?

既然方先生對可能結果發生的機率完全無知,最大化期望值原則顯然派不上用場。故此,他只能 求助其他原則。實際上,在此情況下有至少兩條原則可助方先生作理性決策,選取何者則視乎他的個性取向。

若方先生為審慎保守之徒,那他應依從以下原則:

最大最小化原則: 決策者應先比較可供選擇的每個行動的最壞可能後果,然後選擇 引起最壞後果之中的最佳後果 之行動。

在上 表中,我們看到行動1- 4的最壞後果分別為 - $400, -$200, -$100, 及 $50。 行動4引發的最壞後果較其餘行動佳(故稱它「最壞之中的最佳」) ,因此方先生應選擇行動4。

假若方先生較富冒險精神,那以下原則較適合他:

最大最大化原則: 決策者應先比較可供選擇的每個行動的最佳可能後果,然後選擇 引起最佳後果 之中的最佳後果 之行動。

行動1-4的最佳後果分別為$800,$400,$200,及$100。很易看出,行動1為引起最佳之中的最佳的行動。因此,方先生應選擇行動1。