資源描述:
《《定性數(shù)據(jù)的數(shù)量化》PPT課件》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、定性數(shù)據(jù)的數(shù)量化數(shù)學(xué)建模會(huì)遇到各種各樣的實(shí)際問(wèn)題,在許多問(wèn)題中經(jīng)常會(huì)遇到分類(lèi)變量.像前兩年全國(guó)的競(jìng)賽題,公務(wù)員招聘問(wèn)題中專家對(duì)應(yīng)聘者的考評(píng),出版社資源分配問(wèn)題中讀者對(duì)出版物評(píng)價(jià),部門(mén)或圖書(shū)的分類(lèi)等等,都是一些定性數(shù)據(jù).如何處理這些分類(lèi)變量的定性數(shù)據(jù)?一種辦法是直接按定性數(shù)據(jù)建模.如統(tǒng)計(jì)數(shù)據(jù)處理中的對(duì)數(shù)線性模型,Logit模型等等.有很多情況需要將定性數(shù)據(jù)數(shù)量化,再按數(shù)量數(shù)據(jù)用于建立數(shù)學(xué)模型.這就要求定性數(shù)據(jù)數(shù)量化一定要合理,否則即使模型是合理的、可行的,但分析結(jié)果會(huì)脫離實(shí)際,沒(méi)有意義.如何合理地將定性數(shù)據(jù)數(shù)量化?定性數(shù)據(jù)有兩大類(lèi):一類(lèi)數(shù)據(jù)是有順序的,也就是
2、有大小、優(yōu)劣等順序,如專家對(duì)應(yīng)聘者的考評(píng)、讀者對(duì)出版物評(píng)價(jià)等等.另一類(lèi)數(shù)據(jù)則是無(wú)順序,僅有名義,如部門(mén)或圖書(shū)的分類(lèi)等等.對(duì)有順序的定性數(shù)據(jù)往往可直接數(shù)量化,但直接將幾個(gè)等級(jí)數(shù)量化成1、2、3、4是不可取的.如出版社資源分配問(wèn)題中讀者對(duì)出版物評(píng)價(jià)有{不好,勉強(qiáng)可以,一般,較好,非常好}五個(gè)等級(jí),但現(xiàn)實(shí)中人們對(duì)這些等級(jí)有確定的認(rèn)知,不能認(rèn)為這些等級(jí)是等距的,通常人們對(duì)不滿意程度的敏感遠(yuǎn)遠(yuǎn)大于對(duì)滿意程度的敏感.對(duì)這些等級(jí)量值的認(rèn)定是一個(gè)與心理學(xué)有關(guān)的問(wèn)題.一般應(yīng)選擇這種形狀的賦值曲線心理學(xué)文獻(xiàn)處理的方法是采用七級(jí)(或九級(jí))評(píng)價(jià):{很不好,不好,不太好,一般,比較
3、好,挺好,非常好},相應(yīng)標(biāo)為{1,2,3,4,5,6,7},找一個(gè)符合正常心態(tài)的風(fēng)險(xiǎn)厭惡型的賦值曲線,如柯西型函數(shù)式中為待定參數(shù),c為等級(jí)中基本可接受的等級(jí)值,比如在上述分級(jí)中{一般}是可接受的等級(jí),則c=4.然后,最低的定為接近0,即f(1)=0.01,最高的定為1,f(7)=1,再認(rèn)定f(c)=f(4)=0.7,這就可確定出參數(shù)最后定出各等級(jí)的量化值名義定性變量如何數(shù)量化?名義分類(lèi)沒(méi)有量的概念,不可能對(duì)前面順序變量那樣,根據(jù)人們對(duì)各等級(jí)的認(rèn)知,給出各等級(jí)的數(shù)量值.給名義分?jǐn)?shù)量化,需要結(jié)合具體情況,需要有具體個(gè)體的實(shí)測(cè)數(shù)據(jù),也就是說(shuō)要有一批樣本,再使用統(tǒng)
4、計(jì)的分析研究,按照統(tǒng)計(jì)學(xué)一些準(zhǔn)則,賦予適當(dāng)?shù)臄?shù)量值.下面分幾種情形分別考慮.(I)有數(shù)量外基準(zhǔn)值Y場(chǎng)合的量化這時(shí)樣本數(shù)據(jù)形式為項(xiàng)目1c11----c1K12c21----c2K2RcR1----cRKR類(lèi)YY1Y2--Yi--Yn111111111111Y在第j個(gè)項(xiàng)目有cjk類(lèi)的反應(yīng),則在相應(yīng)位置記1,對(duì)一個(gè)項(xiàng)目只能有一種類(lèi)反應(yīng),且必有一種類(lèi)反應(yīng).我們可以定義顯然有這樣,當(dāng)我們給cjk賦予數(shù)量值xjk時(shí),考慮簡(jiǎn)單的線性關(guān)系的話,第i個(gè)體由分類(lèi)項(xiàng)目1---R確定的值為以Y作為基準(zhǔn),當(dāng)然要求α與Y“相近”或相關(guān)程度高,依最小二乘的準(zhǔn)則,用度量“相近”,因此我們
5、要選擇xjk使Q達(dá)到最小,這與經(jīng)典線性回歸分析中求解回歸方程參數(shù)的要求是一樣的.可以用微分求極值的方法,建立正規(guī)方程從中解出xjk.用矩陣形式比較簡(jiǎn)潔.給以矩陣記號(hào)由于各項(xiàng)目對(duì)每一個(gè)i全體類(lèi)的之和均為1,為使A滿秩,從2---R各項(xiàng)目刪除一列,相應(yīng)的xr1取值0,r=2---R.按矩陣記號(hào)正規(guī)方程為解出實(shí)際上,可以用現(xiàn)成的回歸分析軟件求出x,只要輸入向量Y和矩陣A,即可.在數(shù)量化的基礎(chǔ)上可以做一些相應(yīng)的數(shù)值分析,如由x預(yù)y,分析1---R這些分類(lèi)變量間的關(guān)系等等(II)有分類(lèi)外基準(zhǔn)場(chǎng)合的量化外基準(zhǔn)是樣本個(gè)體的分類(lèi),而不是數(shù)值變量.此時(shí)數(shù)據(jù)形式為項(xiàng)目分類(lèi)類(lèi)1
6、c11----c1k12c21----c2k2------RcR1----cRkR11111-----------n1111---T1111-----------nT111樣本總量n=n1+n2+---+nT,我們?nèi)匀唤o予cjk量值xjk,R個(gè)項(xiàng)目間考慮為加性,仍然記則有可以求得α的方差和組間方差顯然應(yīng)該要求經(jīng)計(jì)算,可得代入前面的式子,得下列方程組用矩陣記號(hào),記H=[h(uv,jk)]F=[f(uv,jk)],則方程組為Hx=η2Fx,x’=(x11,--,x1k1,---,xR1,--,xRkR)即[F-1H-η2I]x=0方程組[F-1H-η2I]x=
7、0要x有非零解,則η2應(yīng)是F-1H的特征根,x是相應(yīng)的特征向量.若有s個(gè)非零特征根η12>η22>--->ηs2則可求得x的s組解,可從大到小取定需要的組數(shù),每一個(gè)解確定一個(gè)一維的分類(lèi)判定準(zhǔn)則,幾個(gè)準(zhǔn)則一起可確定多維分類(lèi)判定準(zhǔn)則.這種情形的數(shù)量化實(shí)際上與多元Fisher判別類(lèi)似,可以用其相應(yīng)的軟件進(jìn)行計(jì)算.(III)無(wú)外基準(zhǔn)場(chǎng)合的量化樣本數(shù)據(jù)直接記成下列形式,出現(xiàn)相同特征的個(gè)體應(yīng)該相近,反之在相同個(gè)體中出現(xiàn)的特征應(yīng)該相近.為了衡量個(gè)體與特征間的親近關(guān)系,若個(gè)體有值yi,i=1—Q,特征Lj有值xj,j=1---R,可以定義兩者間相關(guān)系數(shù).個(gè)體特征L1L2-
8、---------LRS1個(gè)1S2個(gè)2------------SQ