資源描述:
《數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用探究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用探究數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用探究 一、數(shù)據(jù)挖掘技術(shù)的基本概念與產(chǎn)生過程 隨著信息技術(shù)的發(fā)展,采集的數(shù)據(jù)量的急劇加大,此時產(chǎn)生了數(shù)據(jù)挖掘,它就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。在對大量的數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理過程中,從而提取得到對一些決策數(shù)據(jù)的支撐。 數(shù)據(jù)挖掘是一個由數(shù)理統(tǒng)計到人工智能,進而到機器學(xué)習(xí)的逐步演變、變化過程。它是一門交叉的學(xué)科,是一門涉及廣泛的學(xué)科,是一門在社會的發(fā)展歷程中不斷
2、前進變化的學(xué)科。它所涉及到的內(nèi)容包括數(shù)據(jù)庫技術(shù)、人機智能、知識庫系統(tǒng)、知識獲取、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計學(xué)、模式識別、信息檢索等,并且在跟著發(fā)展的需要、學(xué)科的進步變化而不斷發(fā)展、向前?! ∮捎跀?shù)據(jù)量之大,傳統(tǒng)的統(tǒng)計分析方法主要是對沒有明確假設(shè)的前提下去挖掘信息,只會使得效率低下,同時,對于問題的解決也在大打折扣,處理的結(jié)果不理想,傳統(tǒng)的這種方法沒有找到數(shù)據(jù)之間的內(nèi)在聯(lián)系,這樣只是看到過去,不能很好的預(yù)測未來,對所要探索的目標不能得出想要的結(jié)論;而數(shù)據(jù)挖掘是將所得到的信息是對前者的補充,得到未知的潛在的東西,是在原有的基礎(chǔ)上發(fā)現(xiàn)那些沒法預(yù)料的、不是
3、靠感官所能察覺的,甚至是一些與生活所違背的,它更是人工智能和統(tǒng)計分析的結(jié)合,是對傳統(tǒng)技術(shù)的進一步拓展,由于對數(shù)據(jù)分析要求的進一步提高,也正是這一些特征才使得數(shù)據(jù)挖掘的結(jié)果而更加有意義與價值?! 《?、數(shù)據(jù)挖掘的相關(guān)技術(shù)與在經(jīng)濟統(tǒng)計中的應(yīng)用 正是由于對于數(shù)據(jù)的大量收集、先進的計算機技術(shù)、數(shù)據(jù)算法的產(chǎn)生、超大規(guī)模數(shù)據(jù)庫的出現(xiàn)、數(shù)據(jù)訪問速度的提升、對數(shù)據(jù)進行精深統(tǒng)計方法計算的能力等等一系列東西的出現(xiàn),從而一步步使得數(shù)據(jù)挖掘技術(shù)的作用越來越廣泛。對于經(jīng)濟統(tǒng)計準確性與實用性的需要,數(shù)據(jù)挖掘技術(shù)才開始慢慢滲透到經(jīng)濟統(tǒng)計工作中。數(shù)據(jù)挖掘技術(shù)的主要方法
4、有: 統(tǒng)計分析方法,數(shù)據(jù)庫字段項之間存在兩種關(guān)系,函數(shù)關(guān)系和相關(guān)關(guān)系,即能用函數(shù)公式表示的確定性關(guān)系與不能用函數(shù)公式表示,但仍是相關(guān)確定性關(guān)系。即利用統(tǒng)計學(xué)原理對數(shù)據(jù)庫中的信息進行分析。本文由.L.收集整理 神經(jīng)網(wǎng)絡(luò)方法,是一種模擬人腦信息加工過程的智能化信息技術(shù)。就像人的神經(jīng)網(wǎng)絡(luò)的過程一樣,經(jīng)過輸入、分析、輸出的過程,而在經(jīng)濟統(tǒng)計過程中得到實際應(yīng)用。它為我們提供了一種完整的、準確的處理過程,使得經(jīng)濟運行模式就像人在接受處理信息的過程一樣而形象化、具體化、實用化,更好地取得經(jīng)濟過程中各個部分之間的聯(lián)系,從而獲得對經(jīng)濟問題的分析,獲得
5、處理辦法。 決策樹是一種用于預(yù)測模型的算法,是基于統(tǒng)計理論的非參數(shù)識別技術(shù),通過對大量數(shù)據(jù)的有目的分類,找到有價值、潛在的信息。正是由于分類速度快,描述簡單,特別適合對經(jīng)濟運行過程中出現(xiàn)的大規(guī)模數(shù)據(jù)的處理工作?! 〈旨碚摰姆椒ǎ且环N研究不精確、不確定知識的數(shù)學(xué)工具,是通過對上下近似集來出來不確定問題。它算法簡單,易于操作;不需要給出額外信息;簡化輸入信息的表達空間。對于不確定的經(jīng)濟因素提供了一種思維方法,正是通過這種近似原則,使得經(jīng)濟決策更加的與需求所接近,為最大利益化的獲得給予有力支撐?! ∵z傳算法,是一種根據(jù)生物自然選擇與遺傳
6、機理的隨機搜索算法,其思路是根據(jù)社會問題,在指定對象的人群中去采集信息,通過對隱含信息的整合、分析,進而得到結(jié)果。它具有隱含性、易于和其它模型結(jié)合,可以對隱含數(shù)據(jù)進行采集,而后把挖掘出的數(shù)據(jù)加以分析,進而得到應(yīng)用。經(jīng)濟問題是一個發(fā)展變化的問題,內(nèi)部有著千絲萬縷的聯(lián)系,參照遺傳算法,我們就可以通過源頭開始,一步步向下延伸,去提取數(shù)據(jù),進行整體分析,這樣就把經(jīng)濟問題具體化、直接化、目標化,使得問題的研究更加直觀,把隱性的表現(xiàn)化,促使經(jīng)濟統(tǒng)計工作更加簡單、直白?! ∪?、數(shù)據(jù)挖掘流程在經(jīng)濟統(tǒng)計中的體現(xiàn) 定義問題,對于經(jīng)濟問題,要定義出所要探究
7、的問題,確定數(shù)據(jù)挖掘的目的。1.數(shù)據(jù)準備,選擇數(shù)據(jù),數(shù)據(jù)預(yù)處理。即對所要探究的經(jīng)濟問題所涉及到的數(shù)據(jù)進行采集,做好前期的一些處理工作,使得數(shù)據(jù)得到簡化,為后續(xù)工作的順利進行做準備。2.數(shù)據(jù)挖掘,根據(jù)數(shù)據(jù)的類型和數(shù)據(jù)的特點選擇相應(yīng)的算法,利用人工智能、統(tǒng)計等方法,去發(fā)掘出有用的信息。3.結(jié)果分析,對上述得到的結(jié)果進行分析、評估,進而通過這一步驟去調(diào)整上面的方法,使得結(jié)果更加貼切。4.知識的運用,將得到的結(jié)果應(yīng)用到實際經(jīng)濟問題中去,進而實現(xiàn)經(jīng)濟的良好運行與發(fā)展?! ∷摹⒔Y(jié)束語 經(jīng)濟的發(fā)展結(jié)果使得各部分之間的聯(lián)系更加的緊密,所包含的內(nèi)容更加
8、的復(fù)雜化,這使得經(jīng)濟統(tǒng)計工作的難度進一步加大,而數(shù)據(jù)挖掘技術(shù)就是通過發(fā)覺事物內(nèi)部之間的聯(lián)系、去揭示那些隱含的、潛在的、未知的但是卻意義重大的東西,而使得經(jīng)濟統(tǒng)計工作能夠得以有效運行。通過采用數(shù)據(jù)挖掘技術(shù),使