資源描述:
《機器學習算法及其應用》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫。
1、機器學習方法及應用1、機器學習學習是生物中樞神經系統(tǒng)的高級整合技能之一,是人類獲取知識的重要途徑和人類智能的重要標志,按照人工智能大師H·Simon的觀點[1]:學習就是系統(tǒng)在不斷重復的工作中對本身能力的增強或改進,使得系統(tǒng)在下一次執(zhí)行同樣或相類似的任務時,會比原來做得更好或效率更高。機器學習則是計算機獲取知識的重要途徑和人工智能的重要標志,是一門研究怎樣用計算機來模擬或實現(xiàn)人類學習活動的學科,是研究如何使機器通過識別和利用現(xiàn)有知識來獲取新知識和新技能。一般認為,機器學習是一個有特定目的的知識獲取過程,其內部表現(xiàn)為從未知到已知這樣一個知識增長過程,其外部表現(xiàn)為系統(tǒng)的某些性能
2、和適應性的改善,使得系統(tǒng)能完成原來不能完成或更好地完成原來可以完成的任務。它既注重知識本身的增加,也注重獲取知識的技能的提高。1.1機器學習基本模型以H·Simon的學習定義作為出發(fā)點,建立如圖1的基本模型。在機器學習的過程中,首要的因素是外部環(huán)境向系統(tǒng)提供信息的質量。外部環(huán)境是以某種形式表達的外界信息集合,它代表外界信息來源;學習是將外界信息加工為知識的過程,先從環(huán)境獲取外部信息,然后對這些信息加工形成知識,并把這些知識放入知識庫中;知識庫中存放指導執(zhí)行部分動作的一般原則,由于環(huán)境向學習系統(tǒng)提供的信息形形色色,信息質量的優(yōu)劣直接影響到學習部分容易實現(xiàn)還是雜亂無章。而知識庫
3、則是影響學習系統(tǒng)設計的第二個因素,由于知識庫可能不同,表達方式各有特點,在選擇表示方式上要兼顧表達能力強、易于推理、易于完善及擴展知識表示等幾個方面的要求。執(zhí)行環(huán)節(jié)是利用知識庫中的知識完成某種任務的過程,并把完成任務過程中所獲得的一些信息反饋給學習環(huán)節(jié),以指導進一步的學習。1.2機器學習的發(fā)展和研究目標機器學習是人工智能研究較為年輕的分支,它的發(fā)展過程大體上分為四個時期[2]。第一階段是20世紀50年代中葉到60年代中葉,屬于熱烈時期。在這個時期,所研究的是“沒有知識”的學習,即“無知”學習。其研究目標是各類自組織系統(tǒng)和自適應系統(tǒng),其主要研究方法是不斷修改系統(tǒng)的控制參數(shù)和改
4、進系統(tǒng)的執(zhí)行能力,不涉及與具體任務有關的知識。本階段的代表性工作是:塞繆爾(Samuel)的下棋程序。但這種學習的結果遠不能滿足人們對機器學習系統(tǒng)的期望。第二階段是在60年代中葉到70年代中葉,被稱為機器學習的冷靜時期。本階段的研究目標是模擬人類的概念學習過程,并采用邏輯結構或圖結構作為機器內部描述。本階段的代表性工作有溫斯頓(Winston)的結構學習系統(tǒng)和海斯羅思(Hayes-Roth)等的基本邏輯的歸納學習系統(tǒng)。-6-第三階段從20世紀70年代中葉到80年代中葉,稱為復興時期。在此期間,人們從學習單個概念擴展到學習多個概念,探索不同的學習策略和方法,且在本階段已開始把
5、學習系統(tǒng)與各種應用結合起來,并取得很大的成功,促進機器學習的發(fā)展。1980年,在美國的卡內基—梅隆(CMU)召開了第一屆機器學習國際研討會,標志著機器學習研究已在全世界興起。當前機器學習圍繞三個主要研究方向進行:1.面向任務:在預定的一些任務中,分析和開發(fā)學習系統(tǒng),以便改善完成任務的水平,這是專家系統(tǒng)研究中提出的研究問題;2.認識模擬:主要研究人類學習過程及其計算機的行為模擬,這是從心理學角度研究的問題;3.理論分析研究:從理論上探討各種可能學習方法的空間和獨立于應用領域之外的各種算法。這三個研究方向各有自己的研究目標,每一個方向的進展都會促進另一個方向的研究。這三個方面的
6、研究都將促進各方面問題和學習基本概念的交叉結合,推動了整個機器學習的研究。機器學習的研究目標大致有三個方向,一個方向是基礎性訓究,發(fā)展各種適合機器特點的學習理淪,探討所有可能的學習方法,比較人類學習與機器學習的異同與聯(lián)系;一個方向是以模擬人類的學習過程出發(fā),試圖建立學習的認識生理學模型,這個方向與認知科學的發(fā)展密切相關;一個方向是應用研究,建立各種實用的學習系統(tǒng)或知識獲取輔助工具,在人工智能科學的應用領域建立自動獲取知識系統(tǒng),積累經驗,完善知識庫與控制知識,進而能使機器的智能水平像人類一樣。2.機器學習方法2.1機械學習機械學習就是記憶,即把新的知識存儲起來,供需要時檢索調
7、用,而無須計算和推理。任何學習系統(tǒng)都必須記住它們獲取的知識。在機械學習系統(tǒng)中,知識的獲取以較為穩(wěn)定和直接的方式進行,不需要系統(tǒng)進行過多的加工。而對于其他學習系統(tǒng),需要對各種建議和訓練例子等信息進行加工處理后,才能存儲起來。當機械學習系統(tǒng)的執(zhí)行部分解決好問題之后,系統(tǒng)就記住該問題及其解??梢园褜W習系統(tǒng)的執(zhí)行部分抽象地看成某個函數(shù),該函數(shù)在得到自變量輸入值(X1,X2,…,Xn)之后,計算并輸出函數(shù)值(Y1,Y2,…,Yp)。機械學習在存儲器中簡單地記憶存儲對((X1,X2,…,Xn),(Y1,Y2,…,Yp))。當需