資源描述:
《垂直搜索、垂直領(lǐng)域解釋》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、個人扯淡:互聯(lián)網(wǎng)的垂直領(lǐng)域?qū)蔀橄乱粋€爆發(fā)點易博達(dá)作者:易博達(dá)2010年07月02日11:13前段時間開始又一次把注意力關(guān)注到“垂直搜索”領(lǐng)域,說實話自己開始接觸電腦是大一,大二開始上網(wǎng),2006年開始用QQ,算一個大菜鳥。聽說搜索引擎這東西是在2005年,聽說垂直搜索這個東西是在2009年,上個月突然的幾件事讓我把這個注意力又一次關(guān)注到了垂直搜索上。我把以前自己經(jīng)常上的幾個網(wǎng)站進(jìn)行了對比分析,發(fā)現(xiàn)從2009年下半年開始國內(nèi)幾家公司又一次在垂直搜索領(lǐng)域厲兵秣馬了。從ASK.com到從百度跳槽出來的一幫人做的aibang.
2、com,再到上海牛逼的不得了的dianping.com,這些在09之前就牛逼哄哄的公司目前掙錢掙得手抽筋,06年財經(jīng)領(lǐng)域異軍突起的老錢莊更是個另類,游戲行業(yè)的4399,這些垂直領(lǐng)域的網(wǎng)站不約而同的開始進(jìn)行精準(zhǔn)化信息的二次開發(fā)。所謂的垂直,就是把一個人的需求劃分開,能分多細(xì)就分多細(xì)衣食住行吃喝拉撒我在去哪上買過機(jī)票,qunar.com我以為是賣機(jī)票的,后來退票的時候才知道他是一個搜索引擎,再后來的了解才知道這個旅游行業(yè)的牛逼是如何的牛逼,把攜程、藝龍給逼到了死角。我在七天上訂酒店,在跟攜程的客戶經(jīng)理扯淡的時候說我不用你們中介
3、,我用終端,攜程也沒辦法。我在當(dāng)當(dāng)上買書幾乎一周一本,因為購物行業(yè)的垂直搜索就是數(shù)據(jù)庫的檢索,我從來不在淘寶上買東西,因為淘寶的垂直搜索雖然龐大,但是可靠性和精準(zhǔn)性要慘淡很多。我再Vancl上買衣服、在360Buy.com上買數(shù)碼。。然后,我把我的這些生活習(xí)慣進(jìn)行了總結(jié),結(jié)果讓我震驚:促使我購買的物品,一定是存在一個精準(zhǔn)合理的數(shù)據(jù)庫檢索平臺,讓我能夠干凈、直接、便捷的達(dá)到我的目的。用過baidu.com的人應(yīng)該都明白,75%的信息都是無用的。上周在金花有幸參加了百度西安站的框搜索會議,百度每年的廣告收入并沒有很好的投入到技
4、術(shù)上,百度的關(guān)鍵詞匹配跟谷歌比,相差十萬八千里。為什么還用它呢?眾里尋他千百度,因為它太容易讓你記住了,雖然他不精準(zhǔn)。Pjblog是一款博客程序,你百度JB,百度會把這種信息給放出來,呵呵,純屬扯淡。我感覺在未來的幾年,垂直領(lǐng)域的信息檢索以及基于精準(zhǔn)信息的電子商務(wù)服務(wù)將會得到很大程度上的應(yīng)用。移動電子商務(wù)是個機(jī)遇,但是勵兵秣馬的主都是有錢沒地方花的上市公司,對于小公司而言,抓住精準(zhǔn)信息行業(yè)的成長機(jī)會或許會有一個很好的發(fā)展。純屬個人看法,歡迎點評。垂直搜索垂直搜索是針對某一個行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對網(wǎng)
5、頁庫中的某類專門的信息進(jìn)行一次整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。相對通用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等提出來的新的搜索引擎服務(wù)模式,通過針對某一特定領(lǐng)域、某一特定人群或某一特定需求提供的有一定價值的信息和相關(guān)服務(wù)。其特點就是“專、精、深”,且具有行業(yè)色彩,相比較通用搜索引擎的海量信息無序化,垂直搜索引擎則顯得更加專注、具體和深入。[缺點是,在我要搜索A時就不能搜索與A具有關(guān)聯(lián)的諸多B了,而現(xiàn)代是個聯(lián)系化的社會。]垂直搜索引擎和普通的網(wǎng)頁搜索引擎的最大區(qū)別是對網(wǎng)頁信息進(jìn)行了結(jié)構(gòu)化信
6、息抽取,也就是將網(wǎng)頁的非結(jié)構(gòu)化數(shù)據(jù)抽取成特定的結(jié)構(gòu)化信息數(shù)據(jù),好比網(wǎng)頁搜索是以網(wǎng)頁為最小單位,基于視覺的網(wǎng)頁塊分析是以網(wǎng)頁塊為最小單位,而垂直搜索是以結(jié)構(gòu)化數(shù)據(jù)為最小單位。然后將這些數(shù)據(jù)存儲到數(shù)據(jù)庫,進(jìn)行進(jìn)一步的加工處理,如:去重、分類等,最后分詞、索引再以搜索的方式滿足用戶的需求。整個過程中,數(shù)據(jù)由非結(jié)構(gòu)化數(shù)據(jù)抽取成結(jié)構(gòu)化數(shù)據(jù),經(jīng)過深度加工處理后以非結(jié)構(gòu)化的方式和結(jié)構(gòu)化的方式返回給用戶。垂直搜索引擎的應(yīng)用方向很多,比如企業(yè)庫搜索、供求信息搜索引擎、購物搜索、房產(chǎn)搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索……幾乎各行各
7、業(yè)各類信息都可以進(jìn)一步細(xì)化成各類的垂直搜索引擎。舉個例子來說明會更容易理解,比如購物搜索引擎,整體流程大致如下:抓取網(wǎng)頁后,對網(wǎng)頁商品信息進(jìn)行抽取,抽取出商品名稱、價格、簡介……甚至可以進(jìn)一步將筆記本簡介細(xì)分成“品牌、型號、CPU、內(nèi)存、硬盤、顯示屏、……”然后對信息進(jìn)行清洗、去重、分類、分析比較、數(shù)據(jù)挖掘,最后通過分詞索引提供用戶搜索、通過分析挖掘提供市場行情報告。垂直搜索引擎大體上需要以下技術(shù)1.Spider2.網(wǎng)頁結(jié)構(gòu)化信息抽取技術(shù)或元數(shù)據(jù)采集技術(shù)3.分詞、索引4.其他信息處理技術(shù)大學(xué)生創(chuàng)業(yè)應(yīng)選垂直領(lǐng)域做老大日前,第
8、十屆品牌中國高峰論壇暨首屆高校創(chuàng)業(yè)者大會在京召開。暴風(fēng)影音董事長兼CEO馮鑫,在北京交通大學(xué)面對來自全國1000多所高校的學(xué)生代表發(fā)表演講,分享了適合高校創(chuàng)業(yè)群體的若干創(chuàng)業(yè)要素,其中“選三流,做老大”這一主張更是引發(fā)了與會者的熱烈討論。馮鑫對“選三流做老大”這一主張破題時表示:“我說的三流,準(zhǔn)確意義上講