《web信息檢索》doc版

《web信息檢索》doc版

ID:33160340

大?。?0.80 KB

頁數(shù):3頁

時間:2019-02-21

《web信息檢索》doc版_第1頁
《web信息檢索》doc版_第2頁
《web信息檢索》doc版_第3頁
資源描述:

《《web信息檢索》doc版》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫。

1、理想的Web信息查詢模式淺談黃小文(浙江省諸暨市實驗職中311800)[摘要]:Web信息查詢模式是互聯(lián)網(wǎng)信息共享的一個重要研究課題,實現(xiàn)信息查詢的快速、高效、準確是研究的目標,本文通過討論就信息查詢涉及的關(guān)鍵技術(shù),闡述了筆者眼中理想的Web信息查詢模式的基本觀點。[關(guān)鍵詞]:Web,信息,查詢模式一、引言二十一世紀是信息高度密集發(fā)展的時代,Internet和Web已經(jīng)成為人們?nèi)粘I詈凸ぷ鲗W習中不可缺少的部分。隨著技術(shù)的發(fā)展和普及,Web已經(jīng)成為一個全球性的巨型公眾信息空間,而且仍在不斷的擴張。幾年前我們還只能夠通過電視和報紙得知新聞或者天氣預報的內(nèi)容,只能通過商場和廠家的

2、宣傳材料獲得產(chǎn)品的資料,只能從少數(shù)認識的人口中得到對最新電影的評價,等等。傳統(tǒng)的信息獲取渠道和方式不僅單一,而且缺乏,往往不能滿足我們對信息的要求。而較之傳統(tǒng)的獲取信息的方式,Web信息查詢具有更大的便利性,也更加全面。無須質(zhì)疑,Web上面巨大的信息量為我們提供了獲取任何信息的可能性。然而正是因為這種“眾人拾柴火焰高”、“大家齊來添磚加瓦”的信息發(fā)布方式,Web上的信息量不斷的膨脹。隨著Web規(guī)模的日益龐大,要在Web中查找自己想要的信息變得越來越困難,很多人都發(fā)現(xiàn)自己花在搜索信息的時間大大增加,有的時候甚至Google了一天還是沒能找到對自己有用的東西。這些現(xiàn)象我們稱之為W

3、eb信息查詢中的“信息迷向”和“信息過載”,也是當前的Web信息查詢模式本身的不足所帶來的問題。要快速、高效、準確的找到所需信息就要改進Web信息查詢模式,這里就我在使用過程中想到的幾個方面來談一下對理想信息查詢的幾點看法。二、理想信息查詢模式對于用戶而言,進行Web信息查詢一般是通過直接瀏覽網(wǎng)頁、使用搜索引擎和分類目錄等等方式進行的。這種信息查詢的模式能夠讓我們盡可能多的得到相關(guān)的信息,但問題正如前面所說,相關(guān)未必是最需要的信息。另外,在對信息查詢需求的描述、對多個信息源的處理方面、對用戶行為的分析和適應等等方面,還存在有很多的不足。3那么,理想的Web信息查詢模式到底是什

4、么樣的呢?相信每一個經(jīng)常使用Web進行信息查詢的人都會有自己的看法。從普通用戶的觀點來看,理想的模式應當使得查詢準確、高效和方便,能夠做到“所答即所問”。以下幾點是我所認為的在現(xiàn)有模式的基礎(chǔ)上,理想的Web信息查詢模式所應當具備的特點:1.符合語言習慣,易于描述需求的查詢語言在查詢語言方面,用戶可以用自然語言將需求清楚地描述,比如“什么樹的葉子有蘋果的味道”、“人民中路附近有那些娛樂設施”這樣符合我們平常語言習慣的句子。而對信息查詢提供者而言,理解用戶的查詢需求需要提取句子的語義,將其轉(zhuǎn)化為機器能夠理解的規(guī)范化的語言,這就需要用到自然語言處理技術(shù)。在目前的搜索引擎中所用到的自

5、然語言處理技術(shù)尚且有限,尤其是中文自然語言處理,只能識別一些簡單的短語和常見的句子結(jié)構(gòu);由于自然語言處理使信息查詢變得更加方便、快速和準確,目前已經(jīng)有越來越多的搜索引擎支持自然語言搜索特性。而如何能讓用戶在Web信息查詢中無限制的使用自然語言,同時又能很好的準確地理解用戶的需求,還需要進一步的研究。系統(tǒng)能否準確表達用戶查詢,這對信息查詢的準確度是最為重要的,同時系統(tǒng)也應能夠向用戶提供模糊查詢方式,所以系統(tǒng)應將數(shù)據(jù)庫技術(shù)與信息檢索技術(shù)聯(lián)合使用,提供精確查詢功能與模糊查詢功能。2.用戶即時需求與個性化的信息主動服務相結(jié)合的操作方式在操作方式上,除了在提交查詢請求后及時地得到結(jié)果,

6、用戶還能夠得到個性化的信息主動服務,定制一些查詢,而信息提供商源源不斷收集Web信息,一旦發(fā)現(xiàn)滿足(或者更為滿足)用戶的查詢則將通知給用戶。這類似于目前的一些信息定制服務,比如一些電子商務網(wǎng)站上注冊定期的電子郵件通知,或者短信的定制,以及一些金融方面的業(yè)務,這些都涉及到信息推送和數(shù)據(jù)流技術(shù)。這些信息定制服務有一個共同點是用戶只能在提供者所提供的內(nèi)容中進行選擇,而采用信息主動服務方式的Web查詢的內(nèi)容和時間不應當受到信息提供者的限制;另外,Web信息主動服務還能夠通過對用戶的需求分析從而找到用戶未表示但潛在的興趣,從而主動的為用戶提供相關(guān)的信息。Web挖掘技術(shù)能夠支持這一點。W

7、eb挖掘是數(shù)據(jù)挖掘應用于Web上的產(chǎn)物。Web挖掘包含了從Web數(shù)據(jù)中發(fā)現(xiàn)潛在有用的未知信息或者知識的全部過程,涵蓋了數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD)的過程。Web結(jié)構(gòu)挖掘和使用記錄挖掘?qū)τ谟脩舳ㄖ苽€性化的查詢服務非常必要。通過這兩種Web挖掘的方式,信息提供者能夠獲取用戶訪問模式信息,幫助理解用戶的意圖和行為,對搜索引擎的信息分類與索引方式進行重新組織,為用戶提供個性化的服務。另外,還可以了解Web結(jié)構(gòu),分析系統(tǒng)性能,改進Web站點的結(jié)構(gòu)及其服務質(zhì)量,改進Web系統(tǒng)設計。33.支持基于內(nèi)容、語義和知識的查

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。