資源描述:
《1. 統(tǒng)計機器學習簡介》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、統(tǒng)計機器學習(StatisticalMachineLearning)盧志武中國人民大學信息學院什么是機器學習“機器學習是一門人工智能的科學,該領(lǐng)域的主要研究對象是人工智能,特別是如何在經(jīng)驗學習中改善具體算法的性能。”“機器學習是對能通過經(jīng)驗自動改進的計算機算法的研究?!薄皺C器學習是用數(shù)據(jù)或以往的經(jīng)驗,以此優(yōu)化計算機程序的性能標準?!?什么是機器學習總結(jié):人工智能的重要組成部分利用經(jīng)驗數(shù)據(jù)改善系統(tǒng)自身性能已廣泛應用于多個領(lǐng)域;大數(shù)據(jù)分析網(wǎng)絡(luò)搜索金融市場預測……3為什么需要機器學習?美國航空航天局JPL實驗室的科學家在《Science》(2001年9月)上撰文指出:機器學習對科學研究的整個
2、過程正起到越來越大的支持作用,……,該領(lǐng)域在今后的若干年內(nèi)將取得穩(wěn)定而快速的發(fā)展Machinelearningformsthecoreofmaypresent-dayAIapplicationsGaryAnthes,FutureWatch:AIcomesofage,www.computerworld.com,2009.1.264為什么需要機器學習?2004年,機器學習被MITTechnologyReview列入10EmergingTechnologiesthatwillChangeYourWorld2010年度圖靈獎授予機器學習理論創(chuàng)始人、哈佛大學LeslieValiant教授2011
3、年度圖靈獎授予概率圖模型奠基者、加州大學洛杉磯分校JudeaPearl教授5圖靈獎連續(xù)兩年頒發(fā)給機器學習先驅(qū)開創(chuàng)者深度學習與機器學習深度學習(deeplearning)是機器學習領(lǐng)域中一系列試圖使用多重非線性變換對數(shù)據(jù)進行多層抽象的算法,本質(zhì)上是機器學習中特征學習方法的一類。至今已有多種深度學習框架:深度神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò),深度信念網(wǎng)絡(luò)。已被應用于多個領(lǐng)域:計算機視覺,語音識別,自然語言處理。6大數(shù)據(jù)與機器學習機器學習幾乎無處不在,即便我們沒有專程調(diào)用它,也經(jīng)常出現(xiàn)在大數(shù)據(jù)應用中。機器學習對大數(shù)據(jù)應用的貢獻主要體現(xiàn)在:促進數(shù)據(jù)科學家們的多產(chǎn)性發(fā)現(xiàn)一些被忽視的方案上述價值來自于機器學
4、習的核心功能:讓分析算法無需人類干預和顯式程序即可對最新數(shù)據(jù)進行學習。這就允許數(shù)據(jù)科學家們根據(jù)典型數(shù)據(jù)集創(chuàng)建一個模型,然后利用算法自動概括和學習這些范例和新的數(shù)據(jù)源。78機器學習示例SARSRiskAgeGenderBloodPressureChestX-RayPre-HospitalAttributesAlbuminBloodpO2WhiteCountRBCCountIn-HospitalAttributes9BooksandReferences主要參考書李航,《統(tǒng)計學習方法》,清華大學出版社,2012.其他參考書米歇爾著,曾華軍等譯,《機器學習》,機械工業(yè)出版社,2008迪達等著,
5、李宏東等譯,《模式分類》(第2版),機械工業(yè)出版社,200310提綱機器學習方法概述貝葉斯決策理論BayesianDecisionTheory常見統(tǒng)計學習方法機器學習的難題與挑戰(zhàn)附錄:1、參考資料2、代表性機器學習開發(fā)包介紹11一、統(tǒng)計學習方法概述12機器學習的發(fā)展機器學習=神經(jīng)科學與認知科學+數(shù)學+計算平凡解問題James(19世紀末):神經(jīng)元相互連接McCulloch,Pitts(20世紀中期):“興奮”和“抑制”Hebb(20世紀中期):學習律神經(jīng)科學Barlow:功能單細胞假設(shè)Hebb:神經(jīng)集合體假設(shè)Rosenblatt:感知機(1956)Rumelhart:BP(1986)P
6、AC(Valiant1984)Schapire:弱學習定理(1990)Freund:AdaBoost(1996)線性不可分問題(Minsky1969)Vapnik:SVM(1991)有限樣本統(tǒng)計理論線性空間表示?i.i.d問題一致性假設(shè)30年Widrow:Madline(1960)Samuel:符號機器學習機器學習研究歷程?泛化理論王玨,機器學習研究回顧與趨勢,2004.9學習系統(tǒng)的一般模型System……InputVariables:HiddenVariables:OutputVariables:15機器學習的基本問題和方法機器學習根據(jù)給定的訓練樣本求對某系統(tǒng)輸入輸出之間依賴關(guān)系的估
7、計,使它能夠?qū)ξ粗敵鲎鞒霰M可能準確的預測。機器學習問題的表示根據(jù)n個獨立同分布觀測樣本確定預測函數(shù)f(x,w)。在一組函數(shù){f(x,w)}中求一個最優(yōu)的函數(shù)f(x,w0)對依賴關(guān)系進行估計,使預測的期望風險最小。環(huán)境學習環(huán)節(jié)知識庫執(zhí)行環(huán)節(jié)Simon的學習模型16學習問題的一般表示學習目標Givenani.i.d.l-samplez1,…,zldrawnfromafixeddistributionF(z)Forafunctionclass’lo