資源描述:
《基于word xml的多維自動(dòng)抽取組件設(shè)計(jì)的開發(fā)與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、JDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJHUNANUNIVERSITY畢業(yè)設(shè)計(jì)(論文)設(shè)計(jì)(論文)題目:基于WordXML的多維論文自動(dòng)抽取組件設(shè)計(jì)學(xué)生姓名張舉學(xué)生學(xué)號20031610526專業(yè)班級軟件工程2004級開發(fā)2班指導(dǎo)老師陳浩系主任(院長)林亞平2008年5月26日DFSGSJDFKGHERUHJKDHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFH
2、KLDSJ基于WordXML的多維論文自動(dòng)抽取組件設(shè)計(jì)摘要多維科技論文是一種新式的科技論文,可以在科技論文創(chuàng)作平臺(tái)幫助下,進(jìn)行方便高效地編輯。較之傳統(tǒng)論文,它擁有更豐富地表達(dá)方式,如音頻、視頻、動(dòng)畫、圖片等。突破傳統(tǒng)科技論文發(fā)表周期長、表達(dá)方式單一等諸多限制,實(shí)現(xiàn)作者、讀者、編審人員的跨時(shí)空溝通和零距離管理。當(dāng)前的科技論文發(fā)表主要是以傳統(tǒng)的word格式的文檔為主,格式要求嚴(yán)格細(xì)致。科技論文工作者往往要花費(fèi)大量的時(shí)間和精力對論文的內(nèi)容和格式進(jìn)行修改。這個(gè)過程繁瑣而低效。本論文研究如何將word文檔導(dǎo)入到多維論文中,通過wordxml方法對word文檔中的元素結(jié)構(gòu)進(jìn)行自動(dòng)分析,
3、結(jié)合OfficeWord編程對象實(shí)現(xiàn)了對word文檔中的標(biāo)題、作者、email、關(guān)鍵字、正文、圖片、音頻、視頻、動(dòng)畫等元素的自動(dòng)抽取的相關(guān)方法,使用數(shù)據(jù)結(jié)構(gòu)在多維論文平臺(tái)中建立起樹型結(jié)構(gòu),有序地表示元素,從而完成了word文檔中各元素的識(shí)別,幫助論文工作者免除了大量的繁瑣過程。設(shè)計(jì)程序時(shí),還考慮到用戶界面的友好性,將識(shí)別出的內(nèi)容立即顯示到界面。該組件使用officeword編程接口,可以作為獨(dú)立的文件格式轉(zhuǎn)換器使用,也可集成于多維論文創(chuàng)作平臺(tái),移植性強(qiáng)。下一步研究更多文檔的xml結(jié)構(gòu),可以將多種格式的文檔兼容,實(shí)現(xiàn)多種格式論文的導(dǎo)入多維論文。關(guān)鍵字:officeword二次
4、開發(fā),xml,多維論文DFSGSJDFKGHERUHJKDHKLSHDKJHKSHKFHLKGHDLSFGHDSKLFHGLDKSFHGLKFGDSJDFJKDHFKAHGJHLKFHJHAKHFLJKDHFKLJASHDFKJHAKLDFHDLSFHKLDSJDesignofmulti-dimensionthesisabstractioncomponentbasedonWordXMLAuthor:JuZhangTutor:HaoChenAbstractMulti-dimensionscientificpaperisanewstylethesis,whichcanbeedi
5、tedeffectivelywiththehelpofscientificpapercompositionplatform.Comparedtotraditionalpaper,multi-dimensionscientificpaperownsricherpresentationmethods:audio,video,animation,picturesetc.breakthroughtherestrictionsoflongdeliverycircle,singlepresentationmethodsandimplementthezero-distantcommuni
6、cationandmanagementofauthor,reader,editor.Currentdeliveredscientificpapercanbecategorizedtotraditionalworddocumentandisformattedstrictly.Thepapercomposermustpayplentyoftimeandenergytomodifythecontentandformat.Thewholeprocessistediousandlowefficient.Thispaperfocusonhowtoimportworddocumentto
7、multi-dimensionplatform,andanalysiselementsofworddocumentbywordxmlautomaticallyandimplementtheautoelementsextractionoftitle,author,email,keywords,context,pictures,audio,video,animationetc.,buildthetree-typestructureofextractedelementswithrelativedatastructurea