資源描述:
《基于多源數(shù)據(jù)的矩陣分解的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、分類號密級注1UDC學(xué)位論文基于多源數(shù)據(jù)的矩陣分解的研究(題名和副題名)闕曉凡(作者姓名)指導(dǎo)教師徐增林教授電子科技大學(xué)成都(姓名、職稱、單位名稱)申請學(xué)位級別碩士學(xué)科專業(yè)計算機軟件與理論提交論文日期2018.3.23論文答辯日期2018.6.5學(xué)位授予單位和日期電子科技大學(xué)2018年6月答辯委員會主席評閱人注1:注明《國際十進分類法UDC》的類號。ResearchonMulti-sourceMatrixFactorizationAMasterThesisSubmittedtoUniversityofElec
2、tronicScienceandTechnologyofChinaDiscipline:ComputerSoftwareandTheoryAuthor:XiaofanQueSupervisor:Prof.ZenglinXuSchool:SchoolofComputerScience&Engineering_ ̄1獨創(chuàng)性聲明I本人聲砸呈挪學(xué)位論文是本人在導(dǎo)耐旨導(dǎo)下進棚研宄工作得的研究成果。據(jù)我所知,除了文中特別加以標(biāo)注和致麵地方力文巾不包含難人己經(jīng)發(fā)表棚寫過的獻腿,也不包含為f尋電子科技大學(xué)
3、或其它教育機構(gòu)的學(xué)位或證書而使用過的材料。與同I細同志對本研篇細任何爾均已在論文巾作了明確的并表不髓。|作者簽名:嘆敵凡日期:—年f月日3Ii侖文使臓權(quán)祥位論文作親全了觸子碰大學(xué)有關(guān)髓、刪學(xué)位論文:?:茂,有權(quán)保留并向隨有關(guān)部n艦雛交論文的復(fù)印件和磁盤,二論文被查閱和借閱。本人授權(quán)電子科技大學(xué)可以將學(xué)位論文的全、分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索,可以采用影印縮印或掃描H轉(zhuǎn)%」手段肺、匯編學(xué)位論文。〔保密的學(xué)位論文在解密后應(yīng)遵守此規(guī)定)訂作者簽名::導(dǎo)師簽名
4、曰期,月曰?年〈¥摘要摘要多源數(shù)據(jù)在現(xiàn)實中的應(yīng)用十分廣泛。例如,在阿茲海默癥的診斷中,醫(yī)生可能會從核磁共振圖像,正電子發(fā)射斷層掃描圖像和腦脊液成分測試中收集病人的信息,通過來自不同源的數(shù)據(jù),醫(yī)生可以得到關(guān)于病人的大腦結(jié)構(gòu)萎縮程度的信息,病人大腦的新陳代謝速率的信息以及病人腦脊液中蛋白質(zhì)水平的信息。這些不同的信息構(gòu)成了醫(yī)生對于病人的診斷。同樣,在機器學(xué)習(xí)中,我們也可以利用多源數(shù)據(jù)間的內(nèi)在聯(lián)系,來提升模型的泛化性能。本文針對多源數(shù)據(jù)的現(xiàn)狀,應(yīng)用矩陣分解方法,做出了如下幾點工作:首先,我們應(yīng)用矩陣分解方法對多源
5、數(shù)據(jù)進行重構(gòu),提出了規(guī)范化多源矩陣分解方法。確切地說,為了對不同數(shù)據(jù)源之間的關(guān)系建模,規(guī)范化多源矩陣分解模型首先使用非負矩陣分解方法將觀察到的多源異構(gòu)數(shù)據(jù)分解成對象因子和特征因子。然后,我們根據(jù)對象因子和特征因子實現(xiàn)對數(shù)據(jù)重構(gòu)。其次,在這個過程中我們假設(shè)同一個數(shù)據(jù)源的不同對象共享相同的特征因子。最后,對于同一個對象的不同的數(shù)據(jù)源的對象因子,我們限定其相似性。第二,為了降低多源數(shù)據(jù)的噪音和驗證重構(gòu)數(shù)據(jù)的有效性,我們提出了自步多任務(wù)學(xué)習(xí)方法對重構(gòu)數(shù)據(jù)進行分類驗證。其中,多任務(wù)學(xué)習(xí)方法利用了多源數(shù)據(jù)之間的共享信息來
6、提高分類的準(zhǔn)確性,是一種常見的處理多源數(shù)據(jù)的方法,而自步學(xué)習(xí)方法則降低了多源數(shù)據(jù)中存在的噪音。通過這兩種方法結(jié)合得到的自步多任務(wù)學(xué)習(xí)方法在一定程度上提高了分類準(zhǔn)確率。第三,我們應(yīng)用矩陣分解方法對多源數(shù)據(jù)進行聚類,并提出了自步多任務(wù)聚類方法。K均值聚類通過矩陣分解將數(shù)據(jù)矩陣近似成不同聚類中心以及聚類指示矩陣的乘積。多任務(wù)聚類方法則在此基礎(chǔ)上通過將多源數(shù)據(jù)矩陣投影到一個共享子空間實現(xiàn)不同任務(wù)之間信息共享的目的。然后,同時學(xué)習(xí)每個聚類任務(wù)的聚類模型以及共享空間的聚類模型,并使用平衡參數(shù)對獨立的聚類模型和共享聚類模型
7、進行協(xié)調(diào)。自步多任務(wù)聚類則在此基礎(chǔ)上加入了自步學(xué)習(xí)框架以及軟權(quán)重策略,從而達到降低多源數(shù)據(jù)噪音的作用。關(guān)鍵詞:矩陣分解,多源數(shù)據(jù),多任務(wù)分類,多任務(wù)聚類,自步學(xué)習(xí)IABSTRACTABSTRACTTheapplicationsaboutmulti-sourcedataisvariousinmanyreal-worldsystems.Forexample,inthediagnosisofAlzheimer’sdisease,doctorsmaycollectpatients’informa-tionfromMR
8、Iimages,PETimagesandCSFtests.Basedonthedatafromdifferentsources,doctorscanobservepatientsbrainstructure,brainmetabolismandproteinleveloncerebrospinal?uid.Theseinformationhelpsdoctorsdiagnosepatientsand