資源描述:
《spss軟件聚類(lèi)分析怎么用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、spss軟件聚類(lèi)分析怎么用,從輸入數(shù)據(jù)到結(jié)果,樹(shù)狀圖結(jié)果。整個(gè)操作怎么進(jìn)行。需要基本思路。excel表:整理一份excel數(shù)據(jù)表,第一列為材料或數(shù)據(jù)的名稱(chēng),后幾列為各項(xiàng)數(shù)值導(dǎo)入數(shù)據(jù):打開(kāi)SPSS,點(diǎn)擊File——Open——DATA,選擇已經(jīng)編輯好的excel表點(diǎn)擊analyze——Classify——Hierarchicalclusteranalysis——數(shù)據(jù)導(dǎo)入variables,表頭項(xiàng)導(dǎo)入labelcaseby;選擇Method項(xiàng),根據(jù)需要選擇方法,點(diǎn)擊Plots選擇dendrogram(打?qū)矗溆喔黜?xiàng)根據(jù)自己需要選擇要計(jì)算的統(tǒng)計(jì)量,點(diǎn)擊ok即可。于SPSS的聚類(lèi)分析的實(shí)用方
2、法(層次聚類(lèi)法和迭代聚類(lèi)法)層次聚類(lèi)法和迭代聚類(lèi)法的主要區(qū)別在于:層次聚類(lèi)法的聚類(lèi)結(jié)果受奇異值的影響非常大,且聚類(lèi)過(guò)程是單方向的,一旦某個(gè)樣本進(jìn)入某一類(lèi),就不可能從該類(lèi)出來(lái),再歸入其他的類(lèi);迭代聚類(lèi)法的聚類(lèi)結(jié)果受奇異值和不合適的聚類(lèi)變量的影響較小,對(duì)于不合適的初始聚類(lèi)可以進(jìn)行反復(fù)調(diào)整,但其缺點(diǎn)是聚類(lèi)結(jié)果對(duì)初始聚類(lèi)非常敏感,而且它也只能得到局部最優(yōu)解.(一)層次聚類(lèi)Analyze-->C1assify-->HierachicalCluster在“C1uster”組中選擇聚類(lèi)類(lèi)型:要進(jìn)行變量聚類(lèi)選擇指定“Vanables”;要進(jìn)行觀測(cè)量聚類(lèi)指定“Cases”。指定參與分析的變量,將選定的變量
3、通過(guò)按鈕箭頭轉(zhuǎn)移到箭頭按鈕右側(cè)的“Variable[s]:”矩形框中;將標(biāo)識(shí)變量通過(guò)下面一個(gè)箭頭按鈕轉(zhuǎn)移到按鈕右側(cè)的“LabelCasesby:”下面的矩形框中。如果不使用系統(tǒng)默認(rèn)值,或由于參與分析的變量量綱不一致需要指定選擇項(xiàng),則應(yīng)該根據(jù)需要有選擇性地執(zhí)行下述某些步驟。1.確定聚類(lèi)方法在主對(duì)話(huà)框中,點(diǎn)擊“Methed”按鈕,展開(kāi)分層聚類(lèi)分析的方法選擇對(duì)話(huà)框,即“HierachicalClusterAnalysis:Method”。在對(duì)話(huà)框中根據(jù)需要指定聚類(lèi)方法、距離測(cè)度的方法、對(duì)數(shù)值進(jìn)行轉(zhuǎn)換方法,即標(biāo)準(zhǔn)化數(shù)值的方法和對(duì)測(cè)度的轉(zhuǎn)換方法。(1)聚類(lèi)方法選擇“C1usterMethod:”表
4、中列出可以選擇的聚類(lèi)方法:Between-groupslinkage組內(nèi)連接Within-groupslinkage組內(nèi)連接Nearestneighbor最近鄰法Furthestneighbor最遠(yuǎn)鄰法Centroidclustering重心聚類(lèi)法Medianclustering中位數(shù)法Ward’smethodWard最小方差法。(后三種聚類(lèi)方法應(yīng)與歐氏距離平方法一起使用)幾種方法的具體情況見(jiàn)下面的英文文檔(2)對(duì)距離的測(cè)度方法選擇在Method中指定的是用哪兩點(diǎn)間的距離的大小決定是否合并兩類(lèi)。距離的具體計(jì)算方法還根據(jù)參與距離的變量類(lèi)型從以下三種對(duì)話(huà)框選擇其一,展開(kāi)選擇菜單后再進(jìn)行具體方
5、法的選擇。這三個(gè)對(duì)話(huà)框分別對(duì)應(yīng)于等間隔測(cè)度的變量(一般為連續(xù)變量)、計(jì)數(shù)變量(一般為離散變量)和二值變量。這里只考慮連續(xù)變量的情況“Interval”(系統(tǒng)默認(rèn))Euclideandistance:Euclidean距離,即兩觀察單位間的距離為其值差的平方和的平方根,該技術(shù)用于Q型聚類(lèi);SquaredEuclideandistance:Euclidean距離平方,即兩觀察單位間的距離為其值差的平方和,該技術(shù)用于Q型聚類(lèi);Cosine:變量矢量的余弦,這是模型相似性的度量;Pearsoncorrelation:相關(guān)系數(shù)距離,適用于R型聚類(lèi);Chebychev:Chebychev距離,即兩觀
6、察單位間的距離為其任意變量的最大絕對(duì)差值,該技術(shù)用于Q型聚類(lèi);Block:City-Block或Manhattan距離,即兩觀察單位間的距離為其值差的絕對(duì)值和,適用于Q型聚類(lèi);Minkowski:距離是一個(gè)絕對(duì)冪的度量,即變量絕對(duì)值的第p次冪之和的平方根;p由用戶(hù)指定Customized:距離是一個(gè)絕對(duì)冪的度量,即變量絕對(duì)值的第p次冪之和的第r次根,p與r由用戶(hù)指定。(3)確定標(biāo)準(zhǔn)化的方法:“TransformValue”“Standardize”下為標(biāo)準(zhǔn)化列表對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的可選擇的方法有:①None不進(jìn)行標(biāo)準(zhǔn)化,是系統(tǒng)默認(rèn)值。②Zscores把數(shù)值標(biāo)準(zhǔn)化到Z分?jǐn)?shù)。③Range-1t
7、ol把數(shù)值標(biāo)準(zhǔn)化到-1到+l范圍內(nèi)。選擇該項(xiàng),對(duì)每個(gè)值用變量或觀測(cè)量的值的范圍去除。如果值范圍是0,所有值保持不變。④Maximummagnitudsof1把數(shù)值標(biāo)準(zhǔn)化到最大值為1。該方法是把正在標(biāo)準(zhǔn)化的變量或觀測(cè)量的值用最大值去除。如果最大值為0,則改用最小值去除,其商加1。⑤Range0to1把數(shù)值標(biāo)準(zhǔn)化到0到1的范圍內(nèi),對(duì)正在被標(biāo)準(zhǔn)化的變量或觀測(cè)量的值剪去最小值,然后除以范圍。如果范圍是0,對(duì)變量或觀測(cè)量的所有值都設(shè)置成0.5