資源描述:
《2013.9.10京東搜索排序白皮書(shū)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、京東搜索排序白皮書(shū)京東搜索團(tuán)隊(duì)2013/09目錄京東搜索排序白皮書(shū)1京東搜索介紹2排序算法21.1文本相關(guān)性21.2類目21.3商品質(zhì)量31.4用戶搜索反饋41.5店鋪服務(wù)質(zhì)量41.6作弊4附錄1:京東搜索作弊行為評(píng)判標(biāo)準(zhǔn)5一、虛假交易5二、錯(cuò)放類目和屬性5三、更換商品612四、標(biāo)題亂填關(guān)鍵字7五、重復(fù)鋪貨8Q&A:常見(jiàn)問(wèn)題9京東搜索介紹隨著京東商品數(shù)量的增長(zhǎng),京東搜索怎樣排序?如何做可以讓商品得到更多曝光機(jī)會(huì)是各個(gè)商家特別關(guān)心的事情。與其他電商搜索類似,京東搜索排序就是將匹配關(guān)鍵詞的商品按照對(duì)用戶需求滿足程度依次展示,目的是幫助用
2、戶快速方便地找到所需商品。此外,用戶還可以按照一定條件對(duì)商品進(jìn)行精確篩選。下面,我們將從以下幾個(gè)方面詳細(xì)介紹京東搜索排序。排序算法當(dāng)用戶輸入關(guān)鍵詞進(jìn)行搜索的時(shí)候,系統(tǒng)會(huì)根據(jù)用戶輸入的關(guān)鍵詞去和系統(tǒng)中的商品做匹配,并根據(jù)商品匹配程度和其他相關(guān)因素對(duì)商品進(jìn)行排序最后將結(jié)果展示給用戶。京東搜索排序考慮的因素如下:121.1文本相關(guān)性文本相關(guān)性即商品的文本描述信息(如商品標(biāo)題,內(nèi)容等)和搜索關(guān)鍵詞的是否相關(guān)或匹配。文本相關(guān)性中商品標(biāo)題和關(guān)鍵詞的相關(guān)度最為重要。商品標(biāo)題錄入注意事項(xiàng):賣(mài)家為了提高自己商品的搜索曝光率,在商品名稱中堆砌和自身商品
3、完全無(wú)關(guān)的關(guān)鍵詞,致使商品標(biāo)題不規(guī)范,不僅會(huì)影響該商品的文本相關(guān)性得分,還會(huì)降低用戶體驗(yàn)。錄入標(biāo)題需要考慮以下原則:1.用戶搜索商品時(shí)常用搜索詞;2.盡量簡(jiǎn)潔明了;3.名稱中不得有錯(cuò)別字。被發(fā)現(xiàn)存在文本作弊的商品在搜索系統(tǒng)中將被過(guò)濾或做降權(quán)處理。舉例:反面例子:金吉家廣博窄書(shū)柜抽屜門(mén)板隨意增減間廳柜可延長(zhǎng)隔斷不靠墻也穩(wěn)定正反面通用創(chuàng)意組合書(shū)柜5X4列橡木色用戶根本無(wú)法找到商品標(biāo)題重點(diǎn),名稱越短文本相關(guān)性越高,無(wú)須寫(xiě)亂七八糟的關(guān)鍵字。正面例子:樂(lè)愛(ài)家創(chuàng)意書(shū)柜收納儲(chǔ)物柜LF-W-1030細(xì)條棕橡1.2類目京東搜索因子中,商品的所在類目(
4、商品的分類)是否合理將影響到商品的排序結(jié)果。在京東,所有商品須放置在具體的分類下,例如iphone手機(jī)放在“手機(jī)”分類下,而iphone充電器則放在“蘋(píng)果配件”分類下。在放置商品類目的時(shí)候,一定要注意,以防放置在不恰當(dāng)?shù)念惸恐校瑢?duì)商品排序造成負(fù)面影響。121.3商品質(zhì)量商品質(zhì)量不僅影響商品的銷(xiāo)量,還影響用戶對(duì)該商品所屬店鋪的信任度和認(rèn)可度。影響商品質(zhì)量的因素如下:a.商品銷(xiāo)量即近期商品銷(xiāo)量,其中不同時(shí)間的銷(xiāo)量進(jìn)行加權(quán)計(jì)算;團(tuán)購(gòu)銷(xiāo)量和虛假交易銷(xiāo)量不計(jì)算在內(nèi)(虛假銷(xiāo)量查出后會(huì)被處罰)。b.銷(xiāo)售額為防止低質(zhì)量商品占用重要展示位置,影響用戶
5、體驗(yàn),銷(xiāo)售額作為其中一個(gè)因素參與商品質(zhì)量分計(jì)算。12c.圖片質(zhì)量圖片是電商網(wǎng)站考量的一個(gè)重要因素,是建立商品和用戶聯(lián)系的第一媒介。影響圖片質(zhì)量的因素有:圖片尺寸,圖片像素,是否精美吸引人,圖片和商品描述是否一致等等。建議大家在圖片處理上考慮用戶習(xí)慣以及展示圖片大小,避免圖片變形或者各種文字信息影響用戶體驗(yàn)。參見(jiàn)《頁(yè)面商品信息管理規(guī)范》d.用戶評(píng)論用戶評(píng)論反映用戶對(duì)商品的滿意程度;商品質(zhì)量和好評(píng)率成正比。e.商品屬性商品屬性是用戶了解商品的重要渠道,商品屬性信息和商品不匹配會(huì)降低用戶體驗(yàn),商品屬性信息和商品的一致性是影響商品排名的另一
6、個(gè)重要因素。為了增大商品展示機(jī)會(huì),采銷(xiāo)或者商家在錄入同一商品屬性時(shí)有時(shí)會(huì)錄入多個(gè)屬性;例如泳衣的人群屬性選擇“女士”也選擇“男士”,此類商品一旦發(fā)現(xiàn)將按作弊商品進(jìn)行排序降權(quán)處理。除上述因素外,用戶關(guān)注度等也是影響商品質(zhì)量的因素。1.4用戶搜索反饋用戶搜索查詢?cè)~后點(diǎn)擊或購(gòu)買(mǎi)商品的行為在用戶搜索反饋系統(tǒng)中計(jì)為該查詢?cè)~與該商品的一次點(diǎn)擊或購(gòu)買(mǎi)數(shù)據(jù)。用戶搜索反饋數(shù)據(jù)反應(yīng)了用戶對(duì)搜索結(jié)果的滿意度,同時(shí)反應(yīng)了對(duì)商品的滿意度。反饋數(shù)據(jù)包括:某查詢?cè)~結(jié)果中商品的點(diǎn)擊量和下單量,用戶通過(guò)搜索進(jìn)入商品單品頁(yè)的平均時(shí)間,商品的搜索點(diǎn)擊轉(zhuǎn)化率。對(duì)于部分商家
7、惡意刷搜索點(diǎn)擊和下單的商品,系統(tǒng)將其視為作弊商品,在排序中進(jìn)行降權(quán)處罰。同時(shí)反饋數(shù)據(jù)也會(huì)剔除這些作弊數(shù)據(jù)。121.5店鋪服務(wù)質(zhì)量伴隨京東POP的發(fā)展,商家的服務(wù)質(zhì)量對(duì)京東整體的體驗(yàn)有著舉足輕重的影響。京東搜索希望將有著優(yōu)質(zhì)服務(wù)質(zhì)量店鋪的商品更多的展示給用戶,商家店鋪質(zhì)量評(píng)分的狀況將影響該商家店鋪中的商品在京東搜索的排序結(jié)果。1.6作弊作弊指通過(guò)非正常手段快速提升商品在搜索結(jié)果的排序。作弊行為會(huì)嚴(yán)重影響用戶的搜索體驗(yàn),對(duì)通過(guò)提升自身服務(wù)質(zhì)量的商品或者賣(mài)家是不公平的。為減少作弊行為對(duì)搜索的不良影響,被判定為作弊的商品將根據(jù)其作弊程度進(jìn)行
8、降權(quán)或者屏蔽處理。目前京東搜索作弊的主要方式有:商品標(biāo)題關(guān)鍵詞堆砌、虛假交易、重復(fù)鋪貨、錯(cuò)放類目等。具體的評(píng)判規(guī)則見(jiàn)附錄一。作弊、商品質(zhì)量分、店鋪服務(wù)質(zhì)量分和開(kāi)放平臺(tái)賣(mài)家積分管理相互影響。商家的商品如果存在搜索作弊情況,該商家會(huì)根據(jù)開(kāi)