資源描述:
《《定性數(shù)據(jù)的數(shù)量化》PPT課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、定性數(shù)據(jù)的數(shù)量化數(shù)學(xué)建模會遇到各種各樣的實際問題,在許多問題中經(jīng)常會遇到分類變量.像前兩年全國的競賽題,公務(wù)員招聘問題中專家對應(yīng)聘者的考評,出版社資源分配問題中讀者對出版物評價,部門或圖書的分類等等,都是一些定性數(shù)據(jù).如何處理這些分類變量的定性數(shù)據(jù)?一種辦法是直接按定性數(shù)據(jù)建模.如統(tǒng)計數(shù)據(jù)處理中的對數(shù)線性模型,Logit模型等等.有很多情況需要將定性數(shù)據(jù)數(shù)量化,再按數(shù)量數(shù)據(jù)用于建立數(shù)學(xué)模型.這就要求定性數(shù)據(jù)數(shù)量化一定要合理,否則即使模型是合理的、可行的,但分析結(jié)果會脫離實際,沒有意義.如何合理地將定性數(shù)據(jù)數(shù)量化?定性數(shù)據(jù)有兩大類:一類數(shù)據(jù)是有順序的,也就是
2、有大小、優(yōu)劣等順序,如專家對應(yīng)聘者的考評、讀者對出版物評價等等.另一類數(shù)據(jù)則是無順序,僅有名義,如部門或圖書的分類等等.對有順序的定性數(shù)據(jù)往往可直接數(shù)量化,但直接將幾個等級數(shù)量化成1、2、3、4是不可取的.如出版社資源分配問題中讀者對出版物評價有{不好,勉強(qiáng)可以,一般,較好,非常好}五個等級,但現(xiàn)實中人們對這些等級有確定的認(rèn)知,不能認(rèn)為這些等級是等距的,通常人們對不滿意程度的敏感遠(yuǎn)遠(yuǎn)大于對滿意程度的敏感.對這些等級量值的認(rèn)定是一個與心理學(xué)有關(guān)的問題.一般應(yīng)選擇這種形狀的賦值曲線心理學(xué)文獻(xiàn)處理的方法是采用七級(或九級)評價:{很不好,不好,不太好,一般,比較
3、好,挺好,非常好},相應(yīng)標(biāo)為{1,2,3,4,5,6,7},找一個符合正常心態(tài)的風(fēng)險厭惡型的賦值曲線,如柯西型函數(shù)式中為待定參數(shù),c為等級中基本可接受的等級值,比如在上述分級中{一般}是可接受的等級,則c=4.然后,最低的定為接近0,即f(1)=0.01,最高的定為1,f(7)=1,再認(rèn)定f(c)=f(4)=0.7,這就可確定出參數(shù)最后定出各等級的量化值名義定性變量如何數(shù)量化?名義分類沒有量的概念,不可能對前面順序變量那樣,根據(jù)人們對各等級的認(rèn)知,給出各等級的數(shù)量值.給名義分?jǐn)?shù)量化,需要結(jié)合具體情況,需要有具體個體的實測數(shù)據(jù),也就是說要有一批樣本,再使用統(tǒng)
4、計的分析研究,按照統(tǒng)計學(xué)一些準(zhǔn)則,賦予適當(dāng)?shù)臄?shù)量值.下面分幾種情形分別考慮.(I)有數(shù)量外基準(zhǔn)值Y場合的量化這時樣本數(shù)據(jù)形式為項目1c11----c1K12c21----c2K2RcR1----cRKR類YY1Y2--Yi--Yn111111111111Y在第j個項目有cjk類的反應(yīng),則在相應(yīng)位置記1,對一個項目只能有一種類反應(yīng),且必有一種類反應(yīng).我們可以定義顯然有這樣,當(dāng)我們給cjk賦予數(shù)量值xjk時,考慮簡單的線性關(guān)系的話,第i個體由分類項目1---R確定的值為以Y作為基準(zhǔn),當(dāng)然要求α與Y“相近”或相關(guān)程度高,依最小二乘的準(zhǔn)則,用度量“相近”,因此我們
5、要選擇xjk使Q達(dá)到最小,這與經(jīng)典線性回歸分析中求解回歸方程參數(shù)的要求是一樣的.可以用微分求極值的方法,建立正規(guī)方程從中解出xjk.用矩陣形式比較簡潔.給以矩陣記號由于各項目對每一個i全體類的之和均為1,為使A滿秩,從2---R各項目刪除一列,相應(yīng)的xr1取值0,r=2---R.按矩陣記號正規(guī)方程為解出實際上,可以用現(xiàn)成的回歸分析軟件求出x,只要輸入向量Y和矩陣A,即可.在數(shù)量化的基礎(chǔ)上可以做一些相應(yīng)的數(shù)值分析,如由x預(yù)y,分析1---R這些分類變量間的關(guān)系等等(II)有分類外基準(zhǔn)場合的量化外基準(zhǔn)是樣本個體的分類,而不是數(shù)值變量.此時數(shù)據(jù)形式為項目分類類1
6、c11----c1k12c21----c2k2------RcR1----cRkR11111-----------n1111---T1111-----------nT111樣本總量n=n1+n2+---+nT,我們?nèi)匀唤o予cjk量值xjk,R個項目間考慮為加性,仍然記則有可以求得α的方差和組間方差顯然應(yīng)該要求經(jīng)計算,可得代入前面的式子,得下列方程組用矩陣記號,記H=[h(uv,jk)]F=[f(uv,jk)],則方程組為Hx=η2Fx,x’=(x11,--,x1k1,---,xR1,--,xRkR)即[F-1H-η2I]x=0方程組[F-1H-η2I]x=
7、0要x有非零解,則η2應(yīng)是F-1H的特征根,x是相應(yīng)的特征向量.若有s個非零特征根η12>η22>--->ηs2則可求得x的s組解,可從大到小取定需要的組數(shù),每一個解確定一個一維的分類判定準(zhǔn)則,幾個準(zhǔn)則一起可確定多維分類判定準(zhǔn)則.這種情形的數(shù)量化實際上與多元Fisher判別類似,可以用其相應(yīng)的軟件進(jìn)行計算.(III)無外基準(zhǔn)場合的量化樣本數(shù)據(jù)直接記成下列形式,出現(xiàn)相同特征的個體應(yīng)該相近,反之在相同個體中出現(xiàn)的特征應(yīng)該相近.為了衡量個體與特征間的親近關(guān)系,若個體有值yi,i=1—Q,特征Lj有值xj,j=1---R,可以定義兩者間相關(guān)系數(shù).個體特征L1L2-
8、---------LRS1個1S2個2------------SQ