決策理論與方法動態(tài)決策分析ppt課件.ppt

決策理論與方法動態(tài)決策分析ppt課件.ppt

ID:50765100

大小:1.03 MB

頁數(shù):16頁

時間:2020-03-14

決策理論與方法動態(tài)決策分析ppt課件.ppt_第1頁
決策理論與方法動態(tài)決策分析ppt課件.ppt_第2頁
決策理論與方法動態(tài)決策分析ppt課件.ppt_第3頁
決策理論與方法動態(tài)決策分析ppt課件.ppt_第4頁
決策理論與方法動態(tài)決策分析ppt課件.ppt_第5頁
資源描述:

《決策理論與方法動態(tài)決策分析ppt課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、決策理論與方法(DecisionMakingTheoryandMethods)《決策理論與方法》編寫組教育部高等學校管理科學與工程類學科專業(yè)教學指導(dǎo)委員會推薦教材第四章動態(tài)決策分析學習目的了解多階段決策、序貫決策的概念及特點;掌握動態(tài)規(guī)劃與決策樹方法及其在多階段決策、序貫決策中的應(yīng)用。本講內(nèi)容4.3序貫決策4.3.1序貫決策的基本概念4.3.2序貫決策的決策方法4.3序貫決策4.3.1序貫決策的基本概念上面的多階段決策,階段數(shù)是確定的。除這種決策外,還有一些決策的階段數(shù)不是事先確定的,它依賴于執(zhí)行決策過程中出現(xiàn)的情況。這種決策問題稱為序貫決策(sequentia

2、ldecisionproblem)。序列決策在進行決策后又產(chǎn)生一些新的情況,需要進行新的決策,接著又有一些新的情況,又需要進行新的決策。這樣決策、情況、決策……,這就構(gòu)成一個序列。4.3序貫決策4.3.1序貫決策的基本概念序貫決策是用于隨機性或不確態(tài)定性動態(tài)系統(tǒng)最優(yōu)化的決策方法。它的特點是:1)所研究的系統(tǒng)是動態(tài)的,即系統(tǒng)所處的狀態(tài)與時間有關(guān),可周期(或連續(xù))地對它觀察;2)決策是序貫地進行的,即每個時刻根據(jù)所觀察到的狀態(tài)和以前狀態(tài)的記錄,從一組可行方案中選用一個最優(yōu)方案(即作最優(yōu)決策),使取決于狀態(tài)的某個目標函數(shù)取最優(yōu)值(極大或極小值);3)系統(tǒng)下一步(或未來

3、)可能出現(xiàn)的狀態(tài)是隨機的或不確定的。4.3序貫決策4.3.1序貫決策的基本概念系統(tǒng)在每次作出決策后下一步可能出現(xiàn)的狀態(tài)是不能確切預(yù)知的,存在兩種情況:1)系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布是已知的,可用客觀概率的條件分布來描述。對于這類系統(tǒng)的序貫決策研究得較完滿的是狀態(tài)轉(zhuǎn)移律具有無后效性的系統(tǒng),相應(yīng)的序貫決策稱為馬爾可夫決策過程,它是將馬爾可夫過程理論與決定性動態(tài)規(guī)劃相結(jié)合的產(chǎn)物。2)系統(tǒng)下一步可能出現(xiàn)的狀態(tài)的概率分布不知道,只能用主觀概率的條件分布來描述。用于這類系統(tǒng)的序貫決策屬于決策分析的內(nèi)容。4.3序貫決策4.3.2序貫決策的決策方法序貫決策的過程是:從初

4、始狀態(tài)開始,每個時刻做出最優(yōu)決策后,接著觀察下一步實際出現(xiàn)的狀態(tài),即收集新的信息,然后再做出新的最優(yōu)決策,反復(fù)進行直至最后。解決序貫決策問題的有效辦法仍然是決策樹,解決序貫決策的關(guān)鍵是確定一個決策序列終止的原則。在下例中,這個原則就是:不管到?jīng)Q策的哪個階段,只要有一個非經(jīng)抽樣的后悔期望值小于進行一次抽樣的費用,決策序列便可終止。4.3序貫決策4.3.2序貫決策的決策方法例4-3-1某工廠的產(chǎn)品每1000件裝成一箱出售。每箱中產(chǎn)品的次品率有0.01,0.40,0.90三種可能,其概率分別為0.2,0.6,0.2?,F(xiàn)在的問題是:出廠前是否要對產(chǎn)品進行嚴格檢驗,將次品

5、挑出??梢赃x擇的行動有兩個:①整箱檢驗,檢驗費為每箱100元;②整箱不檢驗,但如果顧客在使用中發(fā)現(xiàn)次品,每件次品除條換為合格品外還要賠償0.25元損失費。為了更好地做出決定可以先從一箱中隨機抽取1件作為樣本檢驗它,然后根據(jù)這件產(chǎn)品是都次品再決定該箱是否要檢驗,抽樣成本為4.2元。進行第一次抽樣后,除選擇檢驗還是不檢驗外,還可以根據(jù)前面抽樣的結(jié)果,考慮再進行一次抽樣檢驗如此形成一個決策序列。該廠應(yīng)該如何決策。4.3序貫決策4.3.2序貫決策的決策方法解(1)假設(shè)為整箱檢驗;為整箱不檢驗;而表示次品率分別0.01,0.40,0.90的三種自然狀態(tài);表示抽取一件樣品的

6、行動,表示抽取第二件樣品的行動;,為抽樣時次品和合格品的兩個結(jié)果。4.3序貫決策4.3.2序貫決策的決策方法(2)計算益損值和后悔值矩陣。產(chǎn)品檢驗問題的收益矩陣見表4-3-1。由表4-3-1的收益矩陣可得到各行動方案的后悔值矩陣,見表4-3-2。表4-3-1:收益矩陣表表4-3-2:后悔矩陣表(0.2)(0.6)(0.2)-100-100-100-100-2.5-100-100-105(0.2)(0.6)(0.2)97.500001254.3序貫決策4.3.2序貫決策的決策方法(3)抽取一件樣品的抽樣分布見表4-3-3。計算各有關(guān)概率。表4-3-3:抽樣結(jié)果條件

7、概率分布表矩陣表抽樣θ(0.2)θ(0.6)θ(0.2)0.990.60.10.010.40.94.3序貫決策4.3.2序貫決策的決策方法(4)畫出決策樹圖4-3-1,圖中表示決策階段,表示第一次抽樣、第二次抽樣圖4-3-1:決策樹4.3250.283733.300.71630.4220.5782519.503.731.177846.174.1091.9092.9660.7660.60382.21.17782.20.46212.22.20.462153.312.2本章小結(jié)本章介紹了動態(tài)決策的基本概念與基本方法,重點是:多階段決策、序貫決策、決策樹等概念,動態(tài)規(guī)劃

8、、決策樹方法及其在多階段

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。