資源描述:
《ython高級(jí)數(shù)據(jù)處理與可視化.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、AdvancedDataProcessingandVisualizationofPythonPython高級(jí)數(shù)據(jù)處理與可視化DepartmentofComputerScienceandTechnologyDepartmentofUniversityBasicComputerTeaching用Python玩轉(zhuǎn)數(shù)據(jù)聚類分析NanjingUniversity聚類3?聚類分析(clusteranalysis)以相似性為基礎(chǔ)把相似的對(duì)象通過靜態(tài)分類的方法分成不同的組別或者更多的子集–特性?基于相似性?有多個(gè)聚類中心NanjingUniversity4K-MEANSK-均值算法表示
2、以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類,對(duì)最靠近他們的對(duì)象歸類。AB任意選擇k個(gè)對(duì)每個(gè)點(diǎn)確定對(duì)象作為初始其聚類中心點(diǎn)聚類中心不收斂計(jì)算每個(gè)新聚聚類完成類的聚類中心收斂CDNanjingUniversity5一個(gè)日常小例子高數(shù)英語(yǔ)Python音樂File小明88649685#Filename:kmeansStu.pyfrompylabimport*大明92999594fromscipy.cluster.vqimport*小朋91879995list1=[88,74,96,85]大朋78999781list2=[92,99,95,94]scipy.cluster.vq更新list3=
3、[91,87,99,95]后其參數(shù)只支持小萌88789884float和double,所list4=[78,99,97,81]大萌1009510092list5=[88,78,98,84]以此處的數(shù)字都要+.0改成浮點(diǎn)數(shù)形式list6=[100,95,100,92]data=vstack((list1,list2,list3,list4,list5,list6))Output:centroids,_=kmeans(data,2)result,_=vq(data,centroids)[011101]printresultNanjingUniversity6另一個(gè)例子按相鄰
4、兩天的收盤價(jià)漲跌規(guī)律對(duì)2014年第3季度(7月-9月)構(gòu)成道瓊斯工業(yè)指數(shù)的30只股票聚類File#Filename:kmeansDJI.pylistDji=['AXP','BA','CAT','CSCO',…,'VZ','WMT','XOM']quotes=[[0forcolinrange(90)]forrowinrange(30)]listTemp=[[0forcolinrange(90)]forrowinrange(30)]foriinrange(30):quotes[i]=quotes_historical_yahoo_ochl(listDji[i],start,
5、end)listTemp[i][j]=1or-1#1ifthelatterislargerthanformer,otherwisetheresultis-1data=vstack(listTemp)centroids,_=kmeans(data,4)同前一頁(yè),此處result,_=vq(data,centroids)需要改成浮點(diǎn)數(shù)NanjingUniversity7另一個(gè)例子Output:[033203011322012012211321301200]第0類AXP,CVX,DIS,JNJ,MCD,UTX,WMT,XOM第1類GE,GS,JPM,MMM,NKE,PFE,T
6、RV,V第2類CSCO,IBM,INTC,KO,MRK,MSFT,T,VZ第3類BA,CAT,DD,HD,PG,UNHNanjingUniversity8用Python玩轉(zhuǎn)數(shù)據(jù)MATPLOTLIB繪圖基礎(chǔ)NanjingUniversityMatplotlib繪圖9?Matplotlib繪圖最著名Python繪圖庫(kù),主要用于二維繪圖–畫圖質(zhì)量高–方便快捷的繪圖模塊?繪圖API——pyplot模塊?集成庫(kù)——pylab模塊(包含NumPy和pyplot中的常用函數(shù))NanjingUniversity10數(shù)據(jù)源Source可口可樂公司近一年來(lái)股票收盤價(jià)的>>>closeMea
7、nsKO=tempkodf.groupby('month').mean().close>>>closeMeansKO月平均價(jià)month138.589524237.047368337.795238…1042.4882611141.4295001239.201905Name:close,dtype:float64NanjingUniversity11折線圖將可口可樂公司近一年來(lái)股票收盤價(jià)的月平均價(jià)繪制成折線圖File#Filename:closeMeansKO.pyimportmatplotlib.pyplotasplt…listKO=[]f