資源描述:
《《web信息檢索》word版》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、理想的Web信息查詢模式淺談黃小文(浙江省諸暨市實(shí)驗(yàn)職中311800)[摘要]:Web信息查詢模式是互聯(lián)網(wǎng)信息共享的一個(gè)重要研究課題,實(shí)現(xiàn)信息查詢的快速、高效、準(zhǔn)確是研究的目標(biāo),本文通過(guò)討論就信息查詢涉及的關(guān)鍵技術(shù),闡述了筆者眼中理想的Web信息查詢模式的基本觀點(diǎn)。[關(guān)鍵詞]:Web,信息,查詢模式一、引言二十一世紀(jì)是信息高度密集發(fā)展的時(shí)代,Internet和Web已經(jīng)成為人們?nèi)粘I詈凸ぷ鲗W(xué)習(xí)中不可缺少的部分。隨著技術(shù)的發(fā)展和普及,Web已經(jīng)成為一個(gè)全球性的巨型公眾信息空間,而且仍在不斷的擴(kuò)張。幾年前我們還只能夠通
2、過(guò)電視和報(bào)紙得知新聞或者天氣預(yù)報(bào)的內(nèi)容,只能通過(guò)商場(chǎng)和廠家的宣傳材料獲得產(chǎn)品的資料,只能從少數(shù)認(rèn)識(shí)的人口中得到對(duì)最新電影的評(píng)價(jià),等等。傳統(tǒng)的信息獲取渠道和方式不僅單一,而且缺乏,往往不能滿足我們對(duì)信息的要求。而較之傳統(tǒng)的獲取信息的方式,Web信息查詢具有更大的便利性,也更加全面。無(wú)須質(zhì)疑,Web上面巨大的信息量為我們提供了獲取任何信息的可能性。然而正是因?yàn)檫@種“眾人拾柴火焰高”、“大家齊來(lái)添磚加瓦”的信息發(fā)布方式,Web上的信息量不斷的膨脹。隨著Web規(guī)模的日益龐大,要在Web中查找自己想要的信息變得越來(lái)越困難,很多
3、人都發(fā)現(xiàn)自己花在搜索信息的時(shí)間大大增加,有的時(shí)候甚至Google了一天還是沒(méi)能找到對(duì)自己有用的東西。這些現(xiàn)象我們稱之為Web信息查詢中的“信息迷向”和“信息過(guò)載”,也是當(dāng)前的Web信息查詢模式本身的不足所帶來(lái)的問(wèn)題。要快速、高效、準(zhǔn)確的找到所需信息就要改進(jìn)Web信息查詢模式,這里就我在使用過(guò)程中想到的幾個(gè)方面來(lái)談一下對(duì)理想信息查詢的幾點(diǎn)看法。二、理想信息查詢模式對(duì)于用戶而言,進(jìn)行Web信息查詢一般是通過(guò)直接瀏覽網(wǎng)頁(yè)、使用搜索引擎和分類目錄等等方式進(jìn)行的。這種信息查詢的模式能夠讓我們盡可能多的得到相關(guān)的信息,但問(wèn)題正如
4、前面所說(shuō),相關(guān)未必是最需要的信息。另外,在對(duì)信息查詢需求的描述、對(duì)多個(gè)信息源的處理方面、對(duì)用戶行為的分析和適應(yīng)等等方面,還存在有很多的不足。3那么,理想的Web信息查詢模式到底是什么樣的呢?相信每一個(gè)經(jīng)常使用Web進(jìn)行信息查詢的人都會(huì)有自己的看法。從普通用戶的觀點(diǎn)來(lái)看,理想的模式應(yīng)當(dāng)使得查詢準(zhǔn)確、高效和方便,能夠做到“所答即所問(wèn)”。以下幾點(diǎn)是我所認(rèn)為的在現(xiàn)有模式的基礎(chǔ)上,理想的Web信息查詢模式所應(yīng)當(dāng)具備的特點(diǎn):1.符合語(yǔ)言習(xí)慣,易于描述需求的查詢語(yǔ)言在查詢語(yǔ)言方面,用戶可以用自然語(yǔ)言將需求清楚地描述,比如“什么樹(shù)的
5、葉子有蘋(píng)果的味道”、“人民中路附近有那些娛樂(lè)設(shè)施”這樣符合我們平常語(yǔ)言習(xí)慣的句子。而對(duì)信息查詢提供者而言,理解用戶的查詢需求需要提取句子的語(yǔ)義,將其轉(zhuǎn)化為機(jī)器能夠理解的規(guī)范化的語(yǔ)言,這就需要用到自然語(yǔ)言處理技術(shù)。在目前的搜索引擎中所用到的自然語(yǔ)言處理技術(shù)尚且有限,尤其是中文自然語(yǔ)言處理,只能識(shí)別一些簡(jiǎn)單的短語(yǔ)和常見(jiàn)的句子結(jié)構(gòu);由于自然語(yǔ)言處理使信息查詢變得更加方便、快速和準(zhǔn)確,目前已經(jīng)有越來(lái)越多的搜索引擎支持自然語(yǔ)言搜索特性。而如何能讓用戶在Web信息查詢中無(wú)限制的使用自然語(yǔ)言,同時(shí)又能很好的準(zhǔn)確地理解用戶的需求,還
6、需要進(jìn)一步的研究。系統(tǒng)能否準(zhǔn)確表達(dá)用戶查詢,這對(duì)信息查詢的準(zhǔn)確度是最為重要的,同時(shí)系統(tǒng)也應(yīng)能夠向用戶提供模糊查詢方式,所以系統(tǒng)應(yīng)將數(shù)據(jù)庫(kù)技術(shù)與信息檢索技術(shù)聯(lián)合使用,提供精確查詢功能與模糊查詢功能。2.用戶即時(shí)需求與個(gè)性化的信息主動(dòng)服務(wù)相結(jié)合的操作方式在操作方式上,除了在提交查詢請(qǐng)求后及時(shí)地得到結(jié)果,用戶還能夠得到個(gè)性化的信息主動(dòng)服務(wù),定制一些查詢,而信息提供商源源不斷收集Web信息,一旦發(fā)現(xiàn)滿足(或者更為滿足)用戶的查詢則將通知給用戶。這類似于目前的一些信息定制服務(wù),比如一些電子商務(wù)網(wǎng)站上注冊(cè)定期的電子郵件通知,或者
7、短信的定制,以及一些金融方面的業(yè)務(wù),這些都涉及到信息推送和數(shù)據(jù)流技術(shù)。這些信息定制服務(wù)有一個(gè)共同點(diǎn)是用戶只能在提供者所提供的內(nèi)容中進(jìn)行選擇,而采用信息主動(dòng)服務(wù)方式的Web查詢的內(nèi)容和時(shí)間不應(yīng)當(dāng)受到信息提供者的限制;另外,Web信息主動(dòng)服務(wù)還能夠通過(guò)對(duì)用戶的需求分析從而找到用戶未表示但潛在的興趣,從而主動(dòng)的為用戶提供相關(guān)的信息。Web挖掘技術(shù)能夠支持這一點(diǎn)。Web挖掘是數(shù)據(jù)挖掘應(yīng)用于Web上的產(chǎn)物。Web挖掘包含了從Web數(shù)據(jù)中發(fā)現(xiàn)潛在有用的未知信息或者知識(shí)的全部過(guò)程,涵蓋了數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(KDD)的過(guò)程。Web結(jié)
8、構(gòu)挖掘和使用記錄挖掘?qū)τ谟脩舳ㄖ苽€(gè)性化的查詢服務(wù)非常必要。通過(guò)這兩種Web挖掘的方式,信息提供者能夠獲取用戶訪問(wèn)模式信息,幫助理解用戶的意圖和行為,對(duì)搜索引擎的信息分類與索引方式進(jìn)行重新組織,為用戶提供個(gè)性化的服務(wù)。另外,還可以了解Web結(jié)構(gòu),分析系統(tǒng)性能,改進(jìn)Web站點(diǎn)的結(jié)構(gòu)及其服務(wù)質(zhì)量,改進(jìn)Web系統(tǒng)設(shè)計(jì)。33.支持基于內(nèi)容、語(yǔ)義和知識(shí)的查