基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究

ID：36847165

大?。?.57 MB

頁數(shù)：69頁

時間：2019-05-16

基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究_第1頁

基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究_第2頁

基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究_第3頁

基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究_第4頁

基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究_第5頁

資源描述：

《基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究》由會員上傳分享，免費在線閱讀，更多相關內(nèi)容在學術論文-天天文庫。

1、摘要隨著互聯(lián)信息的多元化，互聯(lián)網(wǎng)上海量的信息源能提供豐富的情報信息來源，因此互聯(lián)網(wǎng)上的開源情報越來越受到情報工作人員的重視。本文通過互聯(lián)網(wǎng)開源情報搜集技術和情報分析理論的研究，旨在構建集情報采集、情報分析、情報服務于一體的企業(yè)競爭性情報系統(tǒng)。本文系統(tǒng)地闡述了企業(yè)競爭情報的理論，提出了基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)體系構架，將企業(yè)競爭性情報系統(tǒng)劃分為情報搜集子系統(tǒng)、情報分析子系統(tǒng)和情報服務子系統(tǒng)。在情報搜集子系統(tǒng)中采用了主題的網(wǎng)絡聚焦爬蟲和元搜索數(shù)據(jù)采集技術保證數(shù)據(jù)采集主題的相關性，構建網(wǎng)絡爬蟲器對Web數(shù)據(jù)進行自動采集和下載，通過網(wǎng)頁J下文抽取技術、PDF與Offic

2、e文檔文本轉(zhuǎn)換技術對下載的半結構化數(shù)據(jù)進行結構化處理，并對結構化數(shù)據(jù)采用“I—Match”算法進行文本查重，將數(shù)據(jù)全文索引后保存，構建起企業(yè)競爭性情報系統(tǒng)的情報自動采集和數(shù)據(jù)處理平臺。在情報分析子系統(tǒng)中，采用中文文本信息處理與挖掘相關的技術和方法對搜集的結構化數(shù)據(jù)進行了情報分類分析、企業(yè)戰(zhàn)略網(wǎng)絡分析、競爭對手分析，分析結果構建起企業(yè)競爭情報的產(chǎn)品體系。在情報服務子系統(tǒng)中提出了研究了企業(yè)的互聯(lián)網(wǎng)信息監(jiān)控服務的解決方案，對于監(jiān)控互聯(lián)網(wǎng)上企業(yè)的負面信息和競爭對手動態(tài)具有重要的應用價值。并構建了適合企業(yè)情報搜索服務的搜索引擎結構和提出了情報層次化應用體系?；赪eb開源數(shù)據(jù)構建的企業(yè)競

3、爭性情報系統(tǒng)，能使企業(yè)充分開發(fā)和有效利用互聯(lián)網(wǎng)這個海量信息倉庫，并從中挖掘競爭性的價值情報，對于構建企業(yè)競爭戰(zhàn)略、提高企業(yè)核心競爭力具有十分重要的意義。關鍵詞：企業(yè)競爭情報Web開源情報采集情報挖掘情報分析企業(yè)戰(zhàn)略網(wǎng)絡ABSTRACTWiththediversityofinformationintheInteract，themassiveIntemetinfo冊ationprovidesarichsourceofintelligenceinformation,SOtheintelligenceworkerspaymoreattentiontotheopensourceintel

4、ligence．ThisarticleaimstoconstructanEnterpriseCompetitiveIntelligenceSystem(ECIS)whichassembleintelligenceautomaticcollection，intelligenceanalysisandintelligenceservicetoonewhole，accordingtoopensourceintelligencecollecttechnologyandanalysistheoryresearch．ThisarticleexpoundsEnterpriseCompetit

5、iveintelligencetheorysystematically,putsforwardanECISconstructionbasedonwebopensourcedatamininganddividestheECIStothreeparts：Intelligencecollectionsubsystem，IntelligenceanalysissubsystemandIntelligenceservicesubsystem．Intheintelligencecollectionsubsystem，thepapertakesthethemefocusederawlerme

6、thodandmeta。searchdatacollectingtechnologytoensurethecollecteddatarelativetogiventheme．Andthencreateacrawlertotraverseweblinksanddownloaddataautomatically．Withthesupportofwebpagescontentextraction，PDForOfficedocumentstextconversiontechnology,thecollectedsemi．structuredataisconvertedtostructu

7、raldata．Thepapertakes“I-Match’’algorithmtodetectandremoveduplicatedocuments，thenindexandstorethedata．Tosumup，thissegmentbuildsaautomaticdatacollectingandprocessingplatformfortheECIS．IIltheintelligenceanalysissubsystem，thepaperuseChinesetextinformat

當前文檔最多預覽五頁，下載文檔查看全文

侵權申訴



1 1 2 3 4 5 / 69



此文檔下載收益歸作者所有

當前文檔最多預覽五頁，下載文檔查看全文

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究

基于Web開源數(shù)據(jù)挖掘的企業(yè)競爭情報系統(tǒng)研究

相關文章

相關標簽