文檔復制檢測web服務原型的設計與實現(xiàn)

文檔復制檢測web服務原型的設計與實現(xiàn)

ID:34375448

大?。?.82 MB

頁數(shù):63頁

時間:2019-03-05

文檔復制檢測web服務原型的設計與實現(xiàn)_第1頁
文檔復制檢測web服務原型的設計與實現(xiàn)_第2頁
文檔復制檢測web服務原型的設計與實現(xiàn)_第3頁
文檔復制檢測web服務原型的設計與實現(xiàn)_第4頁
文檔復制檢測web服務原型的設計與實現(xiàn)_第5頁
資源描述:

《文檔復制檢測web服務原型的設計與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫

1、太原理工大學碩士學位論文文檔復制檢測Web服務原型的設計與實現(xiàn)姓名:安旭君申請學位級別:碩士專業(yè):@指導教師:彭新光20090301太原理工大學碩士研究生學位論文文檔復制檢測Web服務原型的設計與實現(xiàn)摘要隨著網(wǎng)絡數(shù)字資源的日益豐富和網(wǎng)絡環(huán)境使人們對存取信息方式的影響,數(shù)字文檔唾手可得,文檔復制變得越來越容易。近年來,學術剽竊現(xiàn)象屢見報端,互聯(lián)網(wǎng)上日益增多的重復網(wǎng)頁降低了檢索效率,給用戶帶來許多不便。文檔復制檢測技術是為了防止數(shù)字文檔的非法復制和擴散而提出的,在知識產(chǎn)權保護和信息檢索中有著重要應用。它可以

2、防止剽竊事件的發(fā)生,提高互聯(lián)網(wǎng)檢索效率,是近年來數(shù)據(jù)安全領域研究的熱點。文檔復制檢測就是判斷一篇給定文檔是否抄襲、剽竊或者復制于另外一篇或者多篇文檔的內容,剽竊不僅僅意味著原封不動地照搬,還包括對原作的移位變換﹑同義詞替換以及改變說法重述等方式。本文首先介紹文檔復制檢測技術的發(fā)展背景、基本概念、國內外的研究現(xiàn)狀、應用領域及科學意義。接著分析現(xiàn)有檢測系統(tǒng)的功能和特點,并探討構建系統(tǒng)所需要的JAVAEE架構體系、STRUTS框架、MVC模式、XML以及SQLServer等相關技術及其特點,提出了建立基于B/

3、S三層架構的文檔復制檢測Web服務原型系統(tǒng)的構思。其次,本文設計并實現(xiàn)了文檔復制檢測Web服務原型系統(tǒng)的體系結構,該系統(tǒng)包括:用戶注冊登錄模塊、文檔上傳模塊、文檔復制檢測模塊、用戶與系統(tǒng)交互模塊。該系統(tǒng)采用SQLServer2000作為后臺數(shù)據(jù)庫服務器,XML表示文檔文件,用TOMCAT6.0作為Web服務器,使用JAVA語言編寫Web服務器有關程序,客戶端用網(wǎng)頁瀏覽器即可訪問本系統(tǒng)?;谏鲜龉ぷ鳎瑢崿F(xiàn)了文檔復制檢測Web服務原型系統(tǒng),該系統(tǒng)基于文檔關鍵詞抽取文檔特征信息,通過特征信息的匹配來檢測文檔之

4、間的相似程度,為用戶提供了在線文檔復制檢測服務。在此基礎上進行了大量的系統(tǒng)測試,測試證明,該原型系統(tǒng)具有較強的可行性。關鍵詞:復制檢測,文本塊,相似度,STRUTSI太原理工大學碩士研究生學位論文DESIGNANDIMPLEMENTOFWEB-SERVICEPROTOTYPEFORCOPYDETECTIONDOCUMENTABSTRACTAsnetworkstechnologyhasrapidlydeveloped,thedigitalresourceisbecomingricherandricher,

5、socopedeasily.Asaresult,thechangerofway,whichpeoplestoreandgetinformation,resultfromnetwork.Finally,thedigitaldocumentsgetmoreandmoreeasytoobtainandtheduplicationofdocumentsbecomesmoreandmoreeasy.Inrecentyears,theplagiarismofacademicpaperhasbeenfoundinth

6、epressrepeatedly;theredundanthomepageinInternethasincreaseddaybydaywhichcutretrievalefficiencyandbroughtdifficultytotheuser.Thetechnologyofdocumentscopydetectionhasbeenputforwardtopreventillegalcopyandspreadofdigitaldocuments,whichisusedinintellectualpro

7、pertyprotectionandinformationretrieval.ItcanpreventplagiarismincidentsandimprovetheInternetretrievalefficiencywhichwasahotpointindatasecurityresearchinrecentyears.Copydetectionfordocumentsistojudgewhetherthegivendocumentplagiarizescontentsofotherdocument

8、sinthedatabase,whichplagiarismoccursinsomeways,suchasbyduplicatingpartialortotaldocumentcontentsandusingdifferentwordsorsentencestoexpressthesamemeaningofthetextsofperviousdocumentsinthedatabase.Firstly,thispaperintroduces

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。