資源描述:
《廈門大學《應用多元統(tǒng)計分析》第01章_多元分析概述》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。
1、第一章多元分析概述第一節(jié)引言第二節(jié)應用背景第三節(jié)計算機在統(tǒng)計分析中的應用第一節(jié)引言多元統(tǒng)計分析是運用數(shù)理統(tǒng)計方法來研究解決多指標問題的理論和方法。近30年來,隨著計算機應用技術(shù)的發(fā)展和科研生產(chǎn)的迫切需要,多元統(tǒng)計分析技術(shù)被廣泛地應用于地質(zhì)、氣象、水文、醫(yī)學、工業(yè)、農(nóng)業(yè)和經(jīng)濟等許多領域,已經(jīng)成為解決實際問題的有效方法。然而,隨著Internet的日益普及,各行各業(yè)都開始采用計算機及相應的信息技術(shù)進行管理和決策,這使得各企事業(yè)單位生成、收集、存儲和處理數(shù)據(jù)的能力大大提高,數(shù)據(jù)量與日俱增,大量復雜信息層出不窮。在信息爆炸的今天,
2、人們已經(jīng)意識到數(shù)據(jù)最值錢的時代已經(jīng)到來。顯然,大量信息在給人們帶來方便的同時也帶來一系列問題。比如:信息量過大,超過了人們掌握、消化的能力;一些信息真?zhèn)坞y辯,從而給信息的正確應用帶來困難;信息組織形式的不一致性導致難以對信息進行有效統(tǒng)一處理等等,這種變化使傳統(tǒng)的數(shù)據(jù)庫技術(shù)和數(shù)據(jù)處理手段已經(jīng)不能滿足要求.Internet的迅猛發(fā)展也使得網(wǎng)絡上的各種資源信息異常豐富,在其中進行信息的查找真如大海撈針。這樣又給多元統(tǒng)計分析理論的發(fā)展和方法的應用提出了新的挑戰(zhàn)。多元統(tǒng)計分析起源于上世紀初,1928年Wishart發(fā)表論文《多元正態(tài)
3、總體樣本協(xié)差陣的精確分布》,可以說是多元分析的開端。20世紀30年代R.A.Fisher、H.Hotelling、S.N.Roy、許寶騄等人作了一系列得奠基性工作,使多元分析在理論上得到了迅速得發(fā)展。20世紀40年代在心理、教育、生物等方面有不少得應用,但由于計算量大,使其發(fā)展受到影響,甚至停滯了相當長得時間。20世紀50年代中期,隨著電子計算機得出現(xiàn)和發(fā)展,使多元分析方法在地質(zhì)、氣象、醫(yī)學、社會學等方面得到廣泛得應用。20世紀60年代通過應用和實踐又完善和發(fā)展了理論,由于新的理論、新的方法不斷涌現(xiàn)又促使它的應用范圍更加擴
4、大。20世紀70年代初期在我國才受到各個領域的極大關注,并在多元統(tǒng)計分析的理論研究和應用上也取得了很多顯著成績,有些研究工作已達到國際水平,并已形成一支科技隊伍,活躍在各條戰(zhàn)線上。在20世紀末與本世紀初,人們獲得的數(shù)據(jù)正以前所未有的速度急劇增加,產(chǎn)生了很多超大型數(shù)據(jù)庫,遍及超級市場銷售、銀行存款、天文學、粒子物理、化學、醫(yī)學以及政府統(tǒng)計等領域,多元統(tǒng)計與人工智能和數(shù)據(jù)庫技術(shù)相結(jié)合,已在經(jīng)濟、商業(yè)、金融、天文等行業(yè)得到了成功的應用。為了讓人們更好的較為系統(tǒng)地掌握多元統(tǒng)計分析的理論與方法,本書重點介紹多元正態(tài)總體的參數(shù)估計和假
5、設檢驗以及常用的統(tǒng)計方法。這些方法包括判別分析、聚類分析、主成分分析、因子分析、對應分析、典型相關分析、多維標度法以及多變量的可視化分析等。與此同時,我們將利用在我國廣泛流行的SPSS統(tǒng)計軟件來實現(xiàn)實證分析,做到在理論的學習中體會應用,在應用的分析中加深理論。第二節(jié)應用背景一統(tǒng)計學的生命力在于應用二多元統(tǒng)計分析方法的應用統(tǒng)計方法是科學研究的一種重要工具,其應用頗為廣泛。特別地,多元統(tǒng)計分析方法常常被應用于自然科學、社會科學等領域的問題中。為了進一步體現(xiàn)多元統(tǒng)計分析方法的應用,我們首先從宏觀的角度認識統(tǒng)計學應用的背景,然后從
6、微觀的角度顯示多元統(tǒng)計分析應用的廣泛性。一、統(tǒng)計學的生命力在于應用(一)統(tǒng)計學產(chǎn)生于應用統(tǒng)計學的發(fā)展過程中可以看出統(tǒng)計學產(chǎn)生于應用,在應用過程中發(fā)展,它的生命力在于應用。300年前,威廉·配第(1623-1687)寫的《政治算術(shù)》,從其研究方法看,被認為是一本統(tǒng)計學著作。政治算術(shù)學派的統(tǒng)計學家將統(tǒng)計方法應用于各自熟悉和感興趣的研究領域,都還是把其應用對象當作肯定性事物之間的聯(lián)系來進行研究的。他們確信,事物現(xiàn)象存在著簡單明了的數(shù)量關系,需要用定性與定量的方法將這種關系(規(guī)律)揭示或描述。使人們能夠更具體、真切地認識世界。數(shù)理
7、統(tǒng)計學派的奠基人凱特勒在統(tǒng)計學中引入了概率論,把它應用與自然界和社會的許多方面,從而為人們認識和說明不確定現(xiàn)象及其相互之間的聯(lián)系開辟出了一條道路。在自然科學和社會科學的許多領域,都留下凱特勒應用統(tǒng)計學研究的烙印。自從凱特勒把概率論引入了應用中的統(tǒng)計學,人們對客觀世界的認識及描述更全面、更接近于實際了。他在廣泛應用拉普拉斯等人概率論中的正態(tài)曲線、誤差法則、大數(shù)法則等成果的過程中,為統(tǒng)計學增添了數(shù)理統(tǒng)計方法,進而又擴展了統(tǒng)計學的應用范圍。在應用中對發(fā)展統(tǒng)計方法貢獻顯著的當推生物統(tǒng)計學派的戈爾登(1822-1921)、皮爾遜(1
8、857-1936)和農(nóng)業(yè)實驗學派的孟德爾(1822--1884)、戈塞特(1876-1937)等。戈爾登六年中測量了近萬人的“身高、體重、闊度、呼吸力、拉力和壓力、手擊的速率、聽力、視力、色覺及個人的其他資料”。在探究這些數(shù)據(jù)內(nèi)在聯(lián)系的過程中提出了今天在自然科學和社會科學領域中廣泛應用的“相關”思想。將