資源描述:
《第7章 判別分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第7章判別分析(DiscriminateAnalysis)zf判別分析一、判別分析的應用領(lǐng)域二、費歇爾判別的思想三、SPSS的判別分析判別函數(shù)的建立判別函數(shù)驗證判別函數(shù)的圖形表示主要內(nèi)容zf27.1判別分析的基本思想一、什么是判別分析?判別分析根據(jù)已知對象的某些觀測指標和所屬類別來判斷未知對象所屬類別的一種統(tǒng)計學方法。如何判斷(判斷依據(jù))?利用已知類別的樣本信息求判別函數(shù),根據(jù)判別函數(shù)對未知樣本所屬類別進行判別判別分析的特點(基本思想)1、是根據(jù)已掌握的、歷史上若干樣本的p個指標數(shù)據(jù)及所屬類別的信息,總結(jié)出該
2、事物分類的規(guī)律性,建立判別公式和判別準則。2、根據(jù)總結(jié)出來的判別公式和判別準則,判別未知類別的樣本點所屬的類別。判別分析的目的:識別一個個體所屬類別zf3判別分析的應用:無處不在醫(yī)學:例1:在醫(yī)學診斷中,一個病人肺部有陰影,醫(yī)生要判斷他患的是肺結(jié)核、肺部良性腫瘤還是肺癌?肺結(jié)核病人、肺部良性腫瘤病人、肺癌病人組成三個總體,病人來自其中一個總體,可通過病人的指標(陰影大小、邊緣是否光滑等)用判別分析判斷他來自哪個總體(即判斷他患的什么病?)zf4經(jīng)濟學:例2:中小企業(yè)的破產(chǎn)模型為了研究中小企業(yè)的破產(chǎn)模型,選定4
3、個經(jīng)濟指標:X1總負債率(現(xiàn)金收益/總負債)X2收益性指標(純收入/總財產(chǎn))X3短期支付能力(流動資產(chǎn)/流動負債)X4生產(chǎn)效率性指標(流動資產(chǎn)/純銷售額)對17個破產(chǎn)企業(yè)(1類)和21個正常運行企業(yè)(2類)進行了調(diào)查,得相關(guān)資料,并構(gòu)建判別函數(shù)。zf5.07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判zf6企業(yè)序號判別類型判別函數(shù)得分判別為1的概率判別的為2概率1231-.5
4、9642.70620.2938041-1.02182.83420.1658052.25719.35312.6468862.34253.32005.679952.27925.34442.6555821.24010.09012.90988zf7例3:根據(jù)信息基礎(chǔ)設(shè)施的發(fā)展狀況,對世界20個國家和地區(qū)進行分類??疾熘笜擞?個:1、X1:每千居民擁有固定電話數(shù)目2、X2:每千人擁有移動電話數(shù)目3、X3:高峰時期每三分鐘國際電話的成本4、X4:每千人擁有電腦的數(shù)目5、X5:每千人中電腦使用率6、X6:每千人中開通互聯(lián)網(wǎng)
5、的人數(shù)zf8分析結(jié)果:將20個國家分為兩類第1類(基礎(chǔ)設(shè)施落后):巴西、墨西哥、波蘭、匈牙利、智利、俄羅斯、泰國、印度、馬來西亞第2類(基礎(chǔ)設(shè)施發(fā)達):瑞典、丹麥、美國、中國臺灣、韓國、日本、德國、法國、新加坡、英國、瑞士如果:我們想知道我國基礎(chǔ)設(shè)施發(fā)展屬于哪一類型?運用判別分析依據(jù):20個國家的分類信息構(gòu)建判別函數(shù)zf9二、判別分析的基本要求:1、分組類型在兩組以上;2、每組樣本(或案例)個數(shù)至少一個以上;3、解釋變量必須是可測量的三、判別分析與聚類分析的比較:1、判別分析是在已知研究對象分成若干類型并已取
6、得各種類型的一批已知樣本的觀測數(shù)據(jù),在此基礎(chǔ)上根據(jù)某些準則建立判別式,然后對未知類型的樣本進行判別分類。2、聚類分析則是對研究對象的類型未知的情況下,對其進行分類的方法。zf103、判別分析和聚類分析往往聯(lián)合使用。當總體分類不清楚時,先用聚類分析對一批樣本進行分類,再用判別分析構(gòu)建判別式對新樣本進行判別。此外判別分析變量情況:被解釋變量為屬性(定類)變量;解釋變量是定量變量。zf11四、判別分析類型及方法(1)按判別的組數(shù)來分,有兩組判別分析和多組判別分析(2)按區(qū)分不同總體所用的數(shù)學模型來分,有線性判別和非
7、線性判別(3)按判別對所處理的變量方法不同有逐步判別、序貫判別。(4)按判別準則來分,有費歇爾判別準則、貝葉斯判別準則。SPSS的判別分析的輸出結(jié)果以費歇爾判別為主。zf127.2距離判別基本思想:即:首先根據(jù)已知分類的數(shù)據(jù),分別計算各類的重心即各組(類)的均值,判別的準則是對任給樣品,計算它到各類重心的距離,哪個距離最小就將它判歸哪個類。zf13zf147.3費歇爾(Fisher)判別所謂Fisher判別法,就是用投影的方法將k個不同總體在p維空間上的點盡可能分散,同一總體內(nèi)的各樣本點盡可能的集中。用方差分
8、析的思想則可構(gòu)建一個較好區(qū)分各個總體的線性判別法。zf15兩類Fisher判別示意圖X2X1G1G2zf16兩類Fisher判別示意圖X2X1G1G2y=c1X1+c2X2zf17(一)基本思想設(shè)有A、B兩個總體,分別有個歷史樣本數(shù)據(jù),每個樣本有P個觀測指標,每個樣本可看作P維空間中的一點。Fisher借助于方差分析的思想構(gòu)造一個線性判別函數(shù):其中,判別系數(shù)的選擇應使得y值滿足:(1)A類和B類的樣