資源描述:
《交互lasso模型及改進admm算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、碩士學(xué)位論文MASTER’SDISSERTATION論文題目交互Lasso模型及改進ADMM算法研究作者姓名仝曉云學(xué)科專業(yè)信息與通信工程指導(dǎo)教師王金甲教授2016年5月中圖分類號:TP391學(xué)校代碼:10216UDC:621.39密級:公開工學(xué)碩士學(xué)位論文交互Lasso模型及改進ADMM算法研究碩士研究生:仝曉云導(dǎo)師:王金甲教授申請學(xué)位:工學(xué)碩士工程領(lǐng)域:信息與通信工程所在單位:信息與通信工程學(xué)院答辯日期:2016年5月授予學(xué)位單位:燕山大學(xué)ADissertationinInformationandCommunicationEngineeri
2、ngINTERACTIVELASSOMODELANDIMPROVEDADMMALGORITHMbyTongXiaoyunSupervisor:ProfessorWangJinjiaYanshanUniversityMay,2016燕山大學(xué)碩士學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:此處所提交的碩士學(xué)位論文《交互Lasso模型及改進ADMM算法研究》,是本人在導(dǎo)師指導(dǎo)下,在燕山大學(xué)攻讀碩士學(xué)位期間獨立進行研究工作所取得的成果。論文中除已注明部分外不包含他人已發(fā)表或撰寫過的研究成果。對本文的研究工作做出重要貢獻的個人和集體,均已在文中以明確方式注明。本聲
3、明的法律結(jié)果將完全由本人承擔(dān)。作者簽字:日期:年月日摘要摘要隨著大數(shù)據(jù)時代的到來,很多領(lǐng)域存在“維數(shù)災(zāi)難”問題。為了從高維數(shù)據(jù)中獲取有用信息,特征選擇已經(jīng)成為眾多學(xué)者的首選。然而傳統(tǒng)特征選擇方法依賴高維數(shù)據(jù)的原始特征,很少考慮特征間的交互。因此本文基于特征交互思想,將其加入回歸模型特征提取與分類,并在模型上添加分層約束來對主效應(yīng)和交互特征建模。而后對其添加罰函數(shù),以達到收縮模型系數(shù),得到主校應(yīng)和交互系數(shù)的稀疏解,增強模型穩(wěn)定性,提高模型效率的目的。首先,本文介紹了弱分層交互logistic模型,并基于一般迭代收縮和閾值優(yōu)化框架應(yīng)用鄰近算子算法
4、求解模型,然后應(yīng)用性質(zhì)簡化模型算法。并在模擬數(shù)據(jù)和真實數(shù)據(jù)中進行試驗。實驗結(jié)果證明本文應(yīng)用的方法具有可解釋性、分類性能高和運行時間低的特點。其次,本文考慮擬合回歸模型的任務(wù),涉及到潛在的大集合的協(xié)變量之間的交互,在此期間希望產(chǎn)生強分層。作者采用一個非常普遍的框架,稱之為FAMILY。它可以轉(zhuǎn)化為一個凸優(yōu)化問題的解,本文對于強分層交互線性lasso,使用改進的交替方向乘子法算法求得模型參數(shù)。該算法保證收斂到全局最優(yōu),可以很容易的專攻任何感興趣的凸罰函數(shù),并允許簡單的擴展到廣義線性模型和高階模型的建立。作者在模擬數(shù)據(jù)、臭氧數(shù)據(jù)和天氣數(shù)據(jù)上進行試驗
5、。結(jié)果表明廣義強分層線性交互能獲得更好的預(yù)測性能。最后,作者研究了廣義強分層交互logistic回歸分類。首先定義了廣義強分層交互logistic模型定義,然后給出了改進交替方向乘子法求解方法。文章最后基于肝炎數(shù)據(jù)和帕金森數(shù)據(jù)進行兩組實驗。實驗結(jié)果證明廣義強分層logistic方法在處理數(shù)據(jù)存在交互特征時優(yōu)勢明顯,并優(yōu)于Lasso方法、分層Lasso方法。關(guān)鍵詞:特征交互;分層;廣義線性回歸;交互logistic回歸;交替方向乘子法-I-AbstractAbstractWiththeadventofthebigdataera,thereare
6、“dimensiondisaster”problemsinmanyfields.Inordertofindouttheusefulinformationfromlargenumberofhigh-dimensiondatas,featureselectionhasbecomethefirstchoiceofmanyexpertsandscholars.However,traditionalfeatureselectionmethodrelyontheoriginalcharacteristicsofhigh-dimensionaldata,a
7、ndseldomconsiderinteractionbetweenthefeatures.Thispaperbasedontheideaoffeatureinteraction,putitintotheregressionmodelfeatureextractionandclassification,andaddthehierarchicalconstraintonthemodelinordertothemaineffectsandinteractivefeaturemodeling.Thenthepenaltyfunctionisadde
8、dintoit.Itspurposeistocontractcoefficientofmodel,getthesparsesolutionofmaineffects