資源描述:
《“機(jī)器學(xué)習(xí)基石”筆記.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、先簡單介紹下這門課程,這門課是在著名的MOOC(MassiveOnlineOpenCourse大型在線公開課)Coursera上的一門關(guān)于機(jī)器學(xué)習(xí)領(lǐng)域的課程,由國立臺(tái)灣大學(xué)的年輕老師林軒田講授。這門叫做機(jī)器學(xué)習(xí)基石的課程,共8周的課程為整個(gè)機(jī)器學(xué)習(xí)課程的上半部分,更偏重于理論和思想而非算法,主要分為四大部分來講授。WhencanMachineLearn?在何時(shí)可以使用機(jī)器學(xué)習(xí)?WhycanMachineLearn?為什么機(jī)器可以學(xué)習(xí)?HowcanMachineLearn?機(jī)器可以怎樣學(xué)習(xí)?HowcanMachineLearnBetter?怎樣能使機(jī)器學(xué)習(xí)更好?每一大
2、塊又分為幾周來講授,每周的課時(shí)分為兩個(gè)大課,每個(gè)大課一般又分為四個(gè)小塊來教學(xué),一個(gè)小塊一般在十分鐘到二十分鐘之間。以VCbound(VC限制)作為總線將整個(gè)基礎(chǔ)課程貫通講解了包括PLA(Perceptronlearningalgorithm感知器)、pocket、二元分類、線性回歸(linearregression)、logistic回歸(logisticregression)等等。以下不用大課小課來敘述了,寫起來感覺怪怪的,就用章節(jié)來分別代表大課時(shí)和小課時(shí)。一、Thelearningproblem機(jī)器學(xué)習(xí)問題。1.CourseIntroduction課程簡介。第一
3、小節(jié)的內(nèi)容就是課程簡介,如上已進(jìn)行了詳細(xì)的介紹,這里就不多贅述。1.2WhatisMachineLearning什么是機(jī)器學(xué)習(xí)?在搞清這個(gè)問題之前,先要搞清什么是學(xué)習(xí)。學(xué)習(xí)可以是人或者動(dòng)物通過觀察思考獲得一定的技巧過程。而機(jī)器學(xué)習(xí)與之類似,是計(jì)算機(jī)通過數(shù)據(jù)和計(jì)算獲得一定技巧的過程。注意這一對比,學(xué)習(xí)是通過觀察而機(jī)器學(xué)習(xí)是通過數(shù)據(jù)(是計(jì)算機(jī)的一種觀察)。對比圖如圖1-1。(本筆記的圖和公式如不加說明皆是出自林老師的課件,下文不會(huì)對此在做說明)圖1-1學(xué)習(xí)與機(jī)器學(xué)習(xí)對比圖a)學(xué)習(xí)b)機(jī)器學(xué)習(xí)那么緊接著就是要解決上述中出現(xiàn)的一個(gè)新的名詞"技巧"(skill)。什么是技巧呢
4、?技巧是一些能力表現(xiàn)的更加出色。機(jī)器學(xué)習(xí)中的技巧如預(yù)測(prediction)、識(shí)別(recognition)。來一個(gè)例子:從股票的數(shù)據(jù)中獲得收益增多的這種技巧,這就是一種機(jī)器學(xué)習(xí)的例子。那既然人也可以通過觀察獲得一個(gè)技巧,為什么還需要機(jī)器學(xué)習(xí)呢?這就是為什么需要機(jī)器學(xué)習(xí),簡單來說,就是兩大原因:一些數(shù)據(jù)或者信息,人來無法獲取,可能是一些人無法識(shí)別的事物,或是數(shù)據(jù)信息量特別大;另一個(gè)原因是人的處理滿足不了需求,比如:定義很多很多的規(guī)則滿足物體識(shí)別或者其他需求;在短時(shí)間內(nèi)通過大量信息做出判斷等等。上面說的是為什么使用機(jī)器學(xué)習(xí),那么什么情況下使用機(jī)器學(xué)習(xí)呢?是不是所有的
5、情況都使用機(jī)器學(xué)習(xí)呢?這里給出了三個(gè)ML(機(jī)器學(xué)習(xí)的英文縮寫)的關(guān)鍵要素:1、存在一個(gè)模式或者說表現(xiàn)可以讓我們對它進(jìn)行改進(jìn)提高;2、規(guī)則并不容易那么定義;3、需要有數(shù)據(jù)。1.3ApplicationsofMachineLearning機(jī)器學(xué)習(xí)的應(yīng)用。這一小節(jié)主要介紹的就是機(jī)器學(xué)習(xí)能用在哪些方面。個(gè)人感覺不是理論介紹的重點(diǎn)(不是說應(yīng)用不重要,剛好相反,其實(shí)個(gè)人認(rèn)為機(jī)器學(xué)習(xí)甚至整個(gè)計(jì)算機(jī)學(xué)科最重要的還是應(yīng)用),就簡述下機(jī)器學(xué)習(xí)可以應(yīng)用在在衣食住行育樂,包含了人類生活的方方面面,所以機(jī)器學(xué)習(xí)的應(yīng)用場景很廣泛很有市場。1.4ComponentsofMachineLearni
6、ng機(jī)器學(xué)習(xí)的組成部分。這一小節(jié)是第一章的重點(diǎn),因?yàn)樗鼘C(jī)器學(xué)習(xí)的理論應(yīng)用符號(hào)及數(shù)學(xué)知識(shí)進(jìn)行表示,而以下各章內(nèi)容也都是在這小節(jié)內(nèi)容的基礎(chǔ)上展開的。從一個(gè)銀行是否會(huì)發(fā)信用卡給用戶的例子引出了機(jī)器學(xué)習(xí)可以分為哪幾個(gè)部分(組件)。1.輸入(input):x∈X(代表銀行所掌握的用戶信息)2.輸出(output):y∈Y(是否會(huì)發(fā)信用卡給用戶)3.未知的函數(shù),即目標(biāo)函數(shù)(targetfunction):f:X→Y(理想的信用卡發(fā)放公式)4.數(shù)據(jù)或者叫做資料(data),即訓(xùn)練樣本(trainingexamples):D={(),(),…,()}(銀行的歷史記錄)5.假設(shè)(h
7、ypothesis),即前面提到的技能,能夠具有更好地表現(xiàn):g:X→Y(能夠?qū)W習(xí)到的公式)可以通過一個(gè)簡單的流程圖表示,如圖1-2所示。圖1-2機(jī)器學(xué)習(xí)的簡單流程圖從圖中可以清楚機(jī)器學(xué)習(xí)就是從我們未知但是卻存在的一個(gè)規(guī)則或者公式f中得到大量的數(shù)據(jù)或者說資料(訓(xùn)練樣本),在這些資料的基礎(chǔ)上得到一個(gè)近似于未知規(guī)則g的過程。這么說還是有點(diǎn)抽象,特別是目標(biāo)函數(shù)f又是未知的,那為什么還能找到一個(gè)假設(shè)g能夠接近f呢?還是以一個(gè)更加詳細(xì)的流程圖來說明這一問題,如圖1-3。圖1-3詳細(xì)的機(jī)器學(xué)習(xí)流程圖這個(gè)流程圖和圖1-2有些不同,其中ML被更詳細(xì)的定義為機(jī)器學(xué)習(xí)算法(learn