OLAP與數(shù)據(jù)挖掘分析.doc

OLAP與數(shù)據(jù)挖掘分析.doc

ID:59253739

大?。?.11 MB

頁數(shù):12頁

時(shí)間:2020-09-08

OLAP與數(shù)據(jù)挖掘分析.doc_第1頁
OLAP與數(shù)據(jù)挖掘分析.doc_第2頁
OLAP與數(shù)據(jù)挖掘分析.doc_第3頁
OLAP與數(shù)據(jù)挖掘分析.doc_第4頁
OLAP與數(shù)據(jù)挖掘分析.doc_第5頁
資源描述:

《OLAP與數(shù)據(jù)挖掘分析.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、浙江萬里學(xué)院實(shí)驗(yàn)報(bào)告成績(jī):教師:課程名稱:OLAP與數(shù)據(jù)挖掘?qū)嶒?yàn)名稱:實(shí)驗(yàn)分析報(bào)告一、實(shí)驗(yàn)?zāi)康模阂酝鶎?shí)驗(yàn)結(jié)果分析、思考、研究、疑惑、經(jīng)歷、體會(huì)、收獲二、實(shí)驗(yàn)內(nèi)容:1.非參數(shù)檢驗(yàn)結(jié)果分析:頻數(shù)表中殘差值越小,說明實(shí)際頻數(shù)與期望頻數(shù)越接近。卡方檢驗(yàn)表中卡方統(tǒng)計(jì)量等于3.492,自由度等于2,對(duì)應(yīng)的概率P值0.174大于顯著性水平0.05。因此接受零假設(shè),人數(shù)的調(diào)動(dòng)只是隨機(jī)誤差造成的,公司人員結(jié)構(gòu)沒有顯著性改變。體會(huì)、收獲:通過上述的實(shí)驗(yàn)我對(duì)非參數(shù)檢驗(yàn)中的卡方檢驗(yàn)有了初步的了解。首先提出零假設(shè):樣本X來自的總體分布服從期望分布或某一理論分布。接著

2、,卡方檢驗(yàn)是利用實(shí)際觀測(cè)值的頻數(shù)與理論的期望頻數(shù)之間的差異來構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,它描述了觀察值和理論值之間的偏離程度。專業(yè)班級(jí):___姓名:__學(xué)號(hào):實(shí)驗(yàn)日期:結(jié)果分析:描述性統(tǒng)計(jì)量表中共選擇了30個(gè)燈泡壽命樣本作二項(xiàng)分布檢驗(yàn),燈泡的平均壽命等于989.13小時(shí),標(biāo)準(zhǔn)差等于40.968小時(shí),最小值等于947小時(shí),壽命最大值等于1084小時(shí)。同時(shí)其25%、50%和75%分位點(diǎn)等于962.75、969.50和996.75小時(shí)。二項(xiàng)檢驗(yàn)表:組1和組2它們各自的樣本容量等于6和24。檢驗(yàn)組1所占比例是否等于0.05。P值0.003小于顯著性水平0.05

3、,可以判斷這批樣本這批產(chǎn)品沒有合格。體會(huì)、收獲:二項(xiàng)分布與卡方分布具有一定的相似性,兩者都是通過與顯著性水平的比較,判斷該分布是否具有顯著性差異。如果概率P值小于或等于用戶設(shè)定的顯著性水平,則拒絕零假設(shè),認(rèn)為總體與某個(gè)指定的二項(xiàng)分布有顯著性差異;相反的,如果概率P值大于顯著性水平,則接受零假設(shè)。結(jié)果分析:游程檢驗(yàn)的Z統(tǒng)計(jì)量值等于-2.384,概率P值0.017小于顯著性水平0.05,說明數(shù)據(jù)的排序呈現(xiàn)一定的規(guī)律性。因此,工業(yè)企業(yè)和商業(yè)企業(yè)的負(fù)債水平有顯著性差異。體會(huì)收獲:游程檢驗(yàn)可用來檢驗(yàn)任何序列的隨機(jī)性,而不管這個(gè)序列是怎樣產(chǎn)生的;此外還

4、可用來判斷兩個(gè)總體的分布是否相同,從而檢驗(yàn)出它們的位置中心有無顯著差異。結(jié)果分析:實(shí)際分布和檢驗(yàn)分布之間的正向最大頻數(shù)差為0.019,負(fù)向最大頻數(shù)差為-0.010,因此用于計(jì)算統(tǒng)計(jì)量的絕對(duì)值最大頻數(shù)差為0.019。隨后的K-S統(tǒng)計(jì)量Z值等于0.750,相應(yīng)的概率P值為0.627,大于顯著性水平0.05。所以接受零假設(shè)。體會(huì)收獲:?jiǎn)螛颖綤-S檢驗(yàn)是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布,一般來說它是比卡方檢驗(yàn)更精確的非參數(shù)檢驗(yàn)法。結(jié)果分析:卡方統(tǒng)計(jì)量等于8.736,自由度等于2,對(duì)應(yīng)的概率P值0.013小于顯著性水平0.05,所以拒絕零假設(shè)

5、。即三種糖果的卡路里含量存在顯著差異。體會(huì)收獲:多獨(dú)立樣本的非參數(shù)檢驗(yàn)是通過分析多組獨(dú)立樣本數(shù)據(jù),推斷樣本來自的多個(gè)總體的分布是否存在顯著差異。結(jié)果分析:Z統(tǒng)計(jì)量值等于-2.558,概率P值0.11大于顯著性水平0.05,所以接受零假設(shè)。即聽音樂和不聽音樂兩種條件下入睡時(shí)間沒有顯著差異。 體會(huì)收獲:兩配對(duì)樣本的非參數(shù)檢驗(yàn)是在對(duì)兩組配對(duì)樣本的總體分布不甚了解的情況下,推斷樣本來自的兩個(gè)總體的分布等是否存在顯著差異的方法。相關(guān)分析結(jié)果分析:由描述統(tǒng)計(jì)表可以看出DJIA和SP的平均均值分別為7743.60和945.10,兩者差距很大。同時(shí),兩者的

6、方差差距也很明顯。 由相關(guān)性表可以看出兩種指數(shù)的Pearson系數(shù)值為0.995;同時(shí)相伴概率P值明顯小于顯著性水平0.01,說明兩者高度正線性相關(guān)。 體會(huì)收獲:根據(jù)對(duì)該實(shí)驗(yàn)的了解,相關(guān)分析能夠幫助我們判斷變量之間有無聯(lián)系以及確定選擇相關(guān)關(guān)系的表現(xiàn)形式及相關(guān)分析方法。結(jié)果分析:由以上各表分析可以看出在控制了股市指數(shù)后,銀行間和交易所市場(chǎng)間的相關(guān)系數(shù)沒有發(fā)生太大變化,仍然為0.906,說明了這兩個(gè)市場(chǎng)的關(guān)系密切。而銀行間國(guó)債市場(chǎng)、交易所國(guó)債市場(chǎng)與股市的偏相關(guān)系數(shù)卻發(fā)生了顯著變化,銀行間市場(chǎng)和股市的Pearson相關(guān)系數(shù)為0.419,而在控制了

7、交易所指數(shù)后,它們之間的偏相關(guān)系數(shù)下降為0.114;同理,交易所國(guó)債市場(chǎng)和股市的相關(guān)系數(shù)也由0.411下降到0.070。這說明了第三方市場(chǎng)對(duì)剩余兩個(gè)市場(chǎng)確實(shí)存在顯著影響。體會(huì)收獲:剛開始做偏相關(guān)分析,我在想偏相關(guān)與簡(jiǎn)單的相關(guān)分析有什么不同,后來隨著實(shí)驗(yàn)的進(jìn)行我了解到偏相關(guān)分析是在相關(guān)分析的基礎(chǔ)上考慮了兩個(gè)因素以外的各種作用,或者說在扣除了其他因素的作用大小以后,重新來測(cè)度這兩個(gè)因素間的關(guān)聯(lián)程度。結(jié)果分析:由上表分析可得,居民消費(fèi)價(jià)格指數(shù)和城市居民消費(fèi)價(jià)格指數(shù)、農(nóng)村居民消費(fèi)價(jià)格指數(shù)和商品銷售價(jià)格指數(shù)的距離都比較小,說明它們都反映了社會(huì)總體或某

8、方面價(jià)格水平的高低;但它和工業(yè)品出廠價(jià)格指數(shù)、原材料等購(gòu)進(jìn)價(jià)格指數(shù)和固定資產(chǎn)投資價(jià)格指數(shù)的距離都較大,說明這些價(jià)格指數(shù)反映的類型有較大差別。收獲體會(huì):距離分析是對(duì)觀測(cè)量之間或變量

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。