資源描述:
《機(jī)器學(xué)習(xí)的簡(jiǎn)介.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、機(jī)器學(xué)習(xí)的簡(jiǎn)介 摘要:機(jī)器學(xué)習(xí)通過以往數(shù)據(jù),運(yùn)用相關(guān)算法,得出可以預(yù)測(cè)的模型,計(jì)算出對(duì)應(yīng)結(jié)果。它基于電腦科學(xué)、統(tǒng)計(jì)學(xué)和數(shù)學(xué)的交互,處在了人工智能與數(shù)據(jù)科學(xué)的核心地位。由于新的機(jī)器學(xué)習(xí)算法和理論的不斷出現(xiàn)和發(fā)展,以及數(shù)據(jù)可用性和CPU處理速度的飛速提高,使得機(jī)器學(xué)習(xí)得到了迅猛的發(fā)展。機(jī)器學(xué)習(xí)對(duì)于當(dāng)代企業(yè)經(jīng)營(yíng)是非常重要的,它關(guān)系到企業(yè)的各行各業(yè)?! £P(guān)鍵詞:機(jī)器學(xué)習(xí);數(shù)據(jù)挖掘;算法 中圖分類號(hào):TP182文獻(xiàn)識(shí)別碼:A文章編號(hào):1001-828X013-0-01 一、機(jī)器學(xué)習(xí)的應(yīng)用 機(jī)器學(xué)習(xí)的方法可以應(yīng)用到許多領(lǐng)域中,包括研究,科技、商業(yè)領(lǐng)域等,這些
2、領(lǐng)域的機(jī)器學(xué)習(xí)運(yùn)用越來越成熟和高效。研究中運(yùn)用機(jī)器學(xué)習(xí)發(fā)現(xiàn)人類不容易發(fā)現(xiàn)的規(guī)律;科技中運(yùn)用機(jī)器學(xué)習(xí)提高了科技解決實(shí)際生活的能力;商業(yè)領(lǐng)域運(yùn)用機(jī)器學(xué)習(xí)更好的挖掘客戶和滿足客戶。除此之外,機(jī)器學(xué)習(xí)也為其他領(lǐng)域帶來不小的突破。機(jī)器學(xué)習(xí)集中解決兩個(gè)問題:其一,如何讓電腦系統(tǒng)利用經(jīng)驗(yàn)數(shù)據(jù)提高我們工作效率。其二,如何有效率地提高機(jī)器學(xué)習(xí)算法的準(zhǔn)確率。機(jī)器學(xué)習(xí)對(duì)于解決科學(xué)和工程中的問題和在各種生活領(lǐng)域的實(shí)踐問題是重要的?! 《C(jī)器學(xué)習(xí)的發(fā)展 過去的二十年機(jī)器學(xué)習(xí)的發(fā)展取得了極大的進(jìn)步。走出了??驗(yàn)室,走向了包括商業(yè)領(lǐng)域的廣泛運(yùn)用。在人工智能中,機(jī)器學(xué)習(xí)被作為一種重
3、要的方法應(yīng)用到電腦可視化,語音識(shí)別,自然語言處理,機(jī)器人控制和其他應(yīng)用中。許多人工智能的開發(fā)者開始認(rèn)識(shí)到,對(duì)于許多應(yīng)用場(chǎng)景,訓(xùn)練一個(gè)系統(tǒng)去出示輸入輸出的結(jié)果,比人工分析內(nèi)在機(jī)理更容易。機(jī)器學(xué)習(xí)的準(zhǔn)確性在很多應(yīng)用中比人類自己的分析結(jié)果要高得多。機(jī)器學(xué)習(xí)的影響已經(jīng)廣泛傳播到運(yùn)用計(jì)算機(jī)和數(shù)據(jù)庫的行業(yè)里,例如,顧客服務(wù),醫(yī)療診斷系統(tǒng),資源分配。在以經(jīng)驗(yàn)為主的學(xué)科,像歷史學(xué),醫(yī)學(xué)到人文學(xué)科,機(jī)器學(xué)習(xí)也有其用武之地。學(xué)習(xí)問題可能被定義為當(dāng)執(zhí)行某些任務(wù)時(shí),通過不斷的訓(xùn)練提高解決能力[1]。例如,在學(xué)習(xí)偵察信用卡詐騙時(shí),我們需要給所有的信用卡交易貼上一個(gè)是不是詐騙的標(biāo)簽
4、。測(cè)量表現(xiàn)將會(huì)由于這個(gè)詐騙鑒別分類器被提高,而它的訓(xùn)練是由以前的一系列詐騙案例所構(gòu)成?! ∪C(jī)器學(xué)習(xí)的模型與算法 在不同的現(xiàn)實(shí)問題中機(jī)器學(xué)習(xí)算法也依據(jù)數(shù)據(jù)與模型的不同有了很大的差別。概念上機(jī)器學(xué)習(xí)算法被視為在一堆候選算法中選取一種對(duì)原始表現(xiàn)擬合最好的程序。機(jī)器學(xué)習(xí)算法的結(jié)論好壞差別非常大,很大程度上因?yàn)樗玫降臄?shù)據(jù)和模型的差別。這里的數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集。它努力從不同的程序中收集最好的算法。許多方法集中在函數(shù)取值問題,它們集中研究函數(shù)。給定一個(gè)輸入,就有一個(gè)輸出。學(xué)習(xí)問題就是如何找出一個(gè)更精確的函數(shù)。通常函數(shù)以參數(shù)化的形式呈現(xiàn),而在另一些情況下,
5、函數(shù)具體形式不太清楚,它是由一個(gè)搜索過程、一個(gè)因子分解、一個(gè)極大化過程、一個(gè)仿真過程等構(gòu)成。即使函數(shù)形式不太清楚,其一般都依賴于參數(shù)與自由度,訓(xùn)練找到這些參數(shù)的過程往往使得表現(xiàn)測(cè)度最優(yōu)化[2]。 下面是機(jī)器學(xué)習(xí)主流的各種算法,算法是機(jī)器學(xué)習(xí)的核心,要了解不同算法的難點(diǎn)所在,更要了解不同算法的優(yōu)勢(shì)以及應(yīng)用場(chǎng)合。算法離不開對(duì)于數(shù)學(xué)基礎(chǔ),也與統(tǒng)計(jì)學(xué)的建模有關(guān)系;由于算法的計(jì)算難度比較大,更與計(jì)算機(jī)的計(jì)算性能有關(guān),所以算法研究顯得非常重要但也比較困難。算法可以說是機(jī)器學(xué)習(xí)的內(nèi)核,一種好算法的提出,對(duì)于機(jī)器學(xué)習(xí)是劃時(shí)代的貢獻(xiàn)?! ∷?、機(jī)器學(xué)習(xí)的商業(yè)重要性 這個(gè)
6、時(shí)代是一個(gè)互聯(lián)網(wǎng)信息爆炸的時(shí)代,隨著網(wǎng)絡(luò)的迅速發(fā)展和普及,使得信息量極大豐富,由于我們獲得海量數(shù)據(jù)的便捷性,我們可以利用的數(shù)據(jù)進(jìn)行分析變得越來越容易,收集的信息門類五花八門。對(duì)于各個(gè)行業(yè),還能收集與行業(yè)、競(jìng)爭(zhēng)對(duì)手、客戶和市場(chǎng)有關(guān)的信息,能夠很好的分析和處理那些對(duì)企業(yè)有重大價(jià)值的信息成為未來企業(yè)脫穎而出的關(guān)鍵。根據(jù)分析結(jié)果找出企業(yè)面臨的問題和漏洞,更好的管理企業(yè),讓企業(yè)取得生存發(fā)展空間?! 】梢姅?shù)據(jù)挖掘?qū)τ谄髽I(yè)的重要性,未來從事機(jī)器學(xué)習(xí)相關(guān)崗位的人員將會(huì)越來越多,數(shù)據(jù)挖據(jù)不僅在一些大的公司有重要的作用,在小企業(yè)里也是不可或缺的。數(shù)據(jù)在公司經(jīng)營(yíng)中提供了非常有
7、價(jià)值的商業(yè)信息,數(shù)據(jù)中蘊(yùn)含了巨大的商業(yè)潛力。數(shù)據(jù)像一個(gè)盒子。不是我們隨便看看的就能得到指導(dǎo)性的意見。大數(shù)據(jù)時(shí)代的到來尤其為管理者既帶來了機(jī)會(huì),又增加了困難。因?yàn)樗麄円鎸?duì)的是更加龐雜的數(shù)據(jù)系統(tǒng),從中找出他們需要的具體規(guī)律,這本身不是一件容易的事。所以以后機(jī)器學(xué)習(xí)會(huì)越來越走向我們的企業(yè),為企業(yè)帶來價(jià)值。