文本檢索中若干問題研究

文本檢索中若干問題研究

ID:36570453

大?。?.78 MB

頁數(shù):105頁

時間:2019-05-12

文本檢索中若干問題研究_第1頁
文本檢索中若干問題研究_第2頁
文本檢索中若干問題研究_第3頁
文本檢索中若干問題研究_第4頁
文本檢索中若干問題研究_第5頁
資源描述:

《文本檢索中若干問題研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、Y弘6205密級:保密期限磚幸卻童夫肇博士研究生學(xué)位論文學(xué)號:她§2塾姓名:王菱塑專業(yè):籃曼蘭籃皇熊理導(dǎo)師:整星熬援學(xué)院;籃息王捏堂院二零零六年五月十三日統(tǒng)滴水算法那樣盲目選擇正下方作為滴水方向,而是考慮水滴的先前方向以及待選擇的切分方向與水滴自身尺寸間的關(guān)系。以手寫數(shù)字為例進(jìn)行的實驗表明,該算法能夠有效克服傳統(tǒng)滴水算法進(jìn)行字符切分時由于連筆或筆畫邊緣毛刺可能帶來的誤差,提高了算法的切分正確率:關(guān)鍵詞:信息檢索文本圖像滴水算法文本分類特征選擇查詢優(yōu)化查詢擴(kuò)展相關(guān)反饋互信息RSEARCHoNSEVERALPRoBLEMSINTEXTRETRJE、後LInfo

2、rIllationRe仃ievaltecbnology(IR)aimsatrecognizinga11dacquiringinfornlation療Dmmesetofinfo肌ation,andplaysa11imporfalltr01einourstudyandsciemificrcs砌.Especiallyintoday,theIntemetisappliedmoreandmorewidely’and也equantityofinfb衄ationincreasessharply.In硒mationRetrievaltectl芏lologyhasbecom

3、eanefficient印proachforpeopletodevelopandmalceuseofallsonsofinfbmationresourcese仃ectively’toacqu沁aIldabsorbinf-0mationfleetlya11droundlyThercsearchofthepresenttheSisinvolvesinrelatedtechnologiesoninfo姍ationretrievalsuchasdocumentpmcessin舀teXtclassificationaIldqueryoptimizationetc.T

4、hefoll叭vingareac:hievedreSultsin也isdissertation:1.FeatureselectionintextclassificationInthemesis,weintroducetlleconceptsofabsolutereliability’relativereliabilityandcompositivercliabilityandsetforththefeatureselectionalgorithmbasedonmumalinfonnationreliability.ThealgO^thmcombinesth

5、econIelativitvbetweenatermandtheclassandthedif矗奠_enceonthete眥amongalltheclasses,i.e.,therelia_bilityofthemaxiummutualinfonnationamongclasses.ExperimentsshowthatcomDaredtothebasicmutua】infonnationmnction,thealgorithmbasedonmutuaJinfo啪ationreliabilitycanimpmvetheprecision,recallandF

6、lmeasuresefrectively.Furthermorc,wealso印plynomalizationtosevaltraditional向nctionsormaI∞10calfbatureselectionbasedonthese矗Inctions.ExDerimentsshowthatnonnalizedf.canlreselectionandlocalf色atureselectioncanimDrovetheclassificationprecisionmoreorless.2.MuticlassclassificationItiscommo

7、ntosetathresholdforeachclassinordertosettletheproblemthatatcxtmaybelOngtodi腩rentclasses.WhenthesimilarityofthetextandoneclassisdbOvetbethresholdofthisclass.th即thetextisclassifiedtothisclass.1nthismcsis,、veresearchonthedetenninationofthresh01d,putfonvardthethresholddetemlinationalg

8、orithmbasedonthemaximizedevaluati

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。