ython高級(jí)數(shù)據(jù)處理與可視化.pdf

ython高級(jí)數(shù)據(jù)處理與可視化.pdf

ID:50510761

大?。?.55 MB

頁(yè)數(shù):50頁(yè)

時(shí)間:2020-03-06

ython高級(jí)數(shù)據(jù)處理與可視化.pdf_第1頁(yè)
ython高級(jí)數(shù)據(jù)處理與可視化.pdf_第2頁(yè)
ython高級(jí)數(shù)據(jù)處理與可視化.pdf_第3頁(yè)
ython高級(jí)數(shù)據(jù)處理與可視化.pdf_第4頁(yè)
ython高級(jí)數(shù)據(jù)處理與可視化.pdf_第5頁(yè)
資源描述:

《ython高級(jí)數(shù)據(jù)處理與可視化.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、AdvancedDataProcessingandVisualizationofPythonPython高級(jí)數(shù)據(jù)處理與可視化DepartmentofComputerScienceandTechnologyDepartmentofUniversityBasicComputerTeaching用Python玩轉(zhuǎn)數(shù)據(jù)聚類分析NanjingUniversity聚類3?聚類分析(clusteranalysis)以相似性為基礎(chǔ)把相似的對(duì)象通過靜態(tài)分類的方法分成不同的組別或者更多的子集–特性?基于相似性?有多個(gè)聚類中心NanjingUniversity4K-MEANSK-均值算法表示

2、以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類,對(duì)最靠近他們的對(duì)象歸類。AB任意選擇k個(gè)對(duì)每個(gè)點(diǎn)確定對(duì)象作為初始其聚類中心點(diǎn)聚類中心不收斂計(jì)算每個(gè)新聚聚類完成類的聚類中心收斂CDNanjingUniversity5一個(gè)日常小例子高數(shù)英語(yǔ)Python音樂File小明88649685#Filename:kmeansStu.pyfrompylabimport*大明92999594fromscipy.cluster.vqimport*小朋91879995list1=[88,74,96,85]大朋78999781list2=[92,99,95,94]scipy.cluster.vq更新list3=

3、[91,87,99,95]后其參數(shù)只支持小萌88789884float和double,所list4=[78,99,97,81]大萌1009510092list5=[88,78,98,84]以此處的數(shù)字都要+.0改成浮點(diǎn)數(shù)形式list6=[100,95,100,92]data=vstack((list1,list2,list3,list4,list5,list6))Output:centroids,_=kmeans(data,2)result,_=vq(data,centroids)[011101]printresultNanjingUniversity6另一個(gè)例子按相鄰

4、兩天的收盤價(jià)漲跌規(guī)律對(duì)2014年第3季度(7月-9月)構(gòu)成道瓊斯工業(yè)指數(shù)的30只股票聚類File#Filename:kmeansDJI.pylistDji=['AXP','BA','CAT','CSCO',…,'VZ','WMT','XOM']quotes=[[0forcolinrange(90)]forrowinrange(30)]listTemp=[[0forcolinrange(90)]forrowinrange(30)]foriinrange(30):quotes[i]=quotes_historical_yahoo_ochl(listDji[i],start,

5、end)listTemp[i][j]=1or-1#1ifthelatterislargerthanformer,otherwisetheresultis-1data=vstack(listTemp)centroids,_=kmeans(data,4)同前一頁(yè),此處result,_=vq(data,centroids)需要改成浮點(diǎn)數(shù)NanjingUniversity7另一個(gè)例子Output:[033203011322012012211321301200]第0類AXP,CVX,DIS,JNJ,MCD,UTX,WMT,XOM第1類GE,GS,JPM,MMM,NKE,PFE,T

6、RV,V第2類CSCO,IBM,INTC,KO,MRK,MSFT,T,VZ第3類BA,CAT,DD,HD,PG,UNHNanjingUniversity8用Python玩轉(zhuǎn)數(shù)據(jù)MATPLOTLIB繪圖基礎(chǔ)NanjingUniversityMatplotlib繪圖9?Matplotlib繪圖最著名Python繪圖庫(kù),主要用于二維繪圖–畫圖質(zhì)量高–方便快捷的繪圖模塊?繪圖API——pyplot模塊?集成庫(kù)——pylab模塊(包含NumPy和pyplot中的常用函數(shù))NanjingUniversity10數(shù)據(jù)源Source可口可樂公司近一年來(lái)股票收盤價(jià)的>>>closeMea

7、nsKO=tempkodf.groupby('month').mean().close>>>closeMeansKO月平均價(jià)month138.589524237.047368337.795238…1042.4882611141.4295001239.201905Name:close,dtype:float64NanjingUniversity11折線圖將可口可樂公司近一年來(lái)股票收盤價(jià)的月平均價(jià)繪制成折線圖File#Filename:closeMeansKO.pyimportmatplotlib.pyplotasplt…listKO=[]f

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。