之所以寫想寫這個(gè)系列的文章,有幾個(gè)原因:
1、淘寶搜索對于一個(gè)賣家來說,太重要了。目前又沒有系統(tǒng)性的介紹,我之前答應(yīng)過要寫,這次剛好有機(jī)會??梢怨┵u家參考。
2、我負(fù)責(zé)了4年多的淘寶搜索技術(shù)和產(chǎn)品,如今不再負(fù)責(zé)搜索業(yè)務(wù)了,也希望能寫一些文章,做為總結(jié)。也算對自己交代。
3、目前對于購物搜索方面的文章太少,我寫出來,可以讓其他做購物搜索的同仁們有所借鑒。
搜索這十多年,就像一幕電影。我現(xiàn)在只不過把劇本零星的整理出來形成系列的文章。
我假定的讀者對象是搜索相關(guān)產(chǎn)品和技術(shù)人員、所有淘寶和天貓上的賣家,以及其他對購物搜索感興趣的朋友。因此文章不能太技術(shù),但又不能太沒有技術(shù),這是很有挑戰(zhàn)的地方。所以大家不要期望太高,照顧一下其他讀者。
雖然是計(jì)劃寫揭秘淘寶搜索系列,但我希望我的文章包括淘寶搜索、一淘搜索、天貓搜索、以及阿里巴巴B2B的搜索,也不會有真的內(nèi)部秘密要公開,能公開的就不是秘密。
那幾個(gè)搜索引擎
B2B、 B2C、C2C這些名詞想必都很熟悉,還有現(xiàn)在比較新潮的O2O, C2B。所謂的模式,都是做出來以后總結(jié)出來的。先知先覺設(shè)定某個(gè)模式,然后去搞,十有八九不會成功。此文章系列不談這些,著重談搜索技術(shù),不同的搜索引擎,搜索的原理基本一致,只是在產(chǎn)品策略,排序因素上有各自的特性。
如果講這幾搜索引擎技術(shù)的完整性,一淘搜索最完整。具體技術(shù)以后再講,先說說一淘搜索。
中國最大的全網(wǎng)購物搜索是一淘搜索(淘寶搜索不是全網(wǎng)購物搜索),但明顯一淘搜索還不屬于購物的主要入口,相比淘寶本身還很小,看似一個(gè)很好的應(yīng)用,卻一直沒有得到市場的認(rèn)可。原因是多方面的,我這里列幾個(gè):
當(dāng)市場一家或幾家獨(dú)大的時(shí)候,站內(nèi)的購物搜索已經(jīng)能解決用戶90%的需求,全網(wǎng)購物搜索引擎的需求不大;
購買商品不同于瀏覽網(wǎng)頁,需要輸入賬號,很少有人愿意到一個(gè)地方搜索,然后到另外一個(gè)地方重新輸入賬號、瀏覽、購買,然后再回來進(jìn)行搜索的;
各個(gè)電商網(wǎng)站的數(shù)據(jù)非常不一樣,如果搜索產(chǎn)品想做到非常好用,技術(shù)難度不是一般的高。
淘寶搜索是最有挑戰(zhàn)性的。我從2000年開始做搜索技術(shù),先后做網(wǎng)站的站內(nèi)搜索、企業(yè)知識搜索、網(wǎng)頁搜索,最后做淘寶搜索。這十幾年中,遇到最具挑戰(zhàn)性的就是淘寶搜索。雖然數(shù)據(jù)量不是最大的,但其技術(shù)的復(fù)雜性,一點(diǎn)都不低于網(wǎng)頁搜索,更具有挑戰(zhàn)的是,其產(chǎn)品策略太難制定,在考慮用戶體驗(yàn)的同時(shí),還需要考慮幾百萬賣家的利益。而且道高一尺魔高一丈,無論多好的策略,很快就可能被市場破壞。
天貓搜索和淘寶搜索都是同一套技術(shù)體系,因?yàn)樗麄円鉀Q的問題都是一樣的。天貓的數(shù)據(jù)量小,商家數(shù)只有淘寶商家數(shù)的百分之幾,商品量也很小,天貓搜索的產(chǎn)品策略和淘寶搜索有明顯的不一樣。天貓搜索不擔(dān)心馬太效應(yīng) (馬太效應(yīng)是指大者越來越大,小者很難成長),天貓可以通過制度要求讓賣家配合很多規(guī)則,例如商標(biāo)、圖片、正品要求、發(fā)票等。當(dāng)然,天貓搜索還會倡導(dǎo)品質(zhì),而不是便宜。
淘寶搜索和天貓搜索都有兩個(gè)類型的應(yīng)用,一個(gè)是直接關(guān)鍵詞搜索,一個(gè)是類目瀏覽(也就是list)。前者好理解,后者是指當(dāng)用戶通過某個(gè)類目名稱進(jìn)入到商品列表頁的時(shí)候,出現(xiàn)的搜索結(jié)果。這兩者都是調(diào)用的同一個(gè)后臺,只不過排序因子有些不一樣。
阿里巴巴B2B的搜索,也就是1688的搜索,我自己還不太了解,等過些天我去拜訪一下相關(guān)的負(fù)責(zé)人,再向大家做介紹。
我們平時(shí)用網(wǎng)頁搜索引擎更多,為了讓大家更清楚了解淘寶搜索的特點(diǎn),我這里把網(wǎng)頁搜索和淘寶搜索的特點(diǎn)做個(gè)對比。
一、搜索流量的價(jià)值
淘寶上每個(gè)賣家店鋪流量來源主要分成三部分:推廣流量(付費(fèi)廣告或免費(fèi)活動(dòng));老客戶(直接登錄、收藏等);搜索流量。由于推廣活動(dòng)的持續(xù)性問題,搜索流量基本上決定了一個(gè)店鋪新客戶來源。如果一個(gè)店鋪新客戶來源不夠的話,在市場上會日益衰落。
目前的網(wǎng)頁搜索引擎公司,盈利的主要來源還在搜索廣告。但對于網(wǎng)頁搜索引擎來說,不是所有的流量都有價(jià)值,例如:在百度上搜索“李湘”,估計(jì)就沒有什么廣告,大多是明星新聞八卦什么的。一般的網(wǎng)頁搜索流量中,大約20%~30%的搜索詞是有商業(yè)價(jià)值的(適合出廣告)。淘寶搜索不一樣的是,基本上99%的流量都是有商業(yè)價(jià)值的。搜索“李湘”,會出來減肥茶,搜索“林志玲”,會出來充氣娃娃;在韓寒和方舟子鬧得很厲害時(shí),搜索“韓寒 VS 方舟子”也有很多個(gè)性T-shirt結(jié)果。某種程度上可以說,如果淘寶搜索流量有10億,其價(jià)值估計(jì)相當(dāng)于網(wǎng)頁搜索流量40億的商業(yè)價(jià)值。
在淘寶搜索上,如果要賣廣告,是最好融合的。因?yàn)樘詫毸阉鞯慕Y(jié)果本身就是商品,廣告也是商品,二者沒有區(qū)別。
二、搜索的社會影響
這個(gè)和淘寶本身的社會影響相關(guān)聯(lián)?,F(xiàn)在淘寶賣家數(shù)達(dá)到800萬,活躍賣家數(shù)應(yīng)該在200萬左右。我們假設(shè)平均每個(gè)活躍賣家背后有5個(gè)人,那么直接在淘寶上就業(yè)的人就有1000萬人,如果加上其他兼職賣家、快遞公司、第三方服務(wù)公司等,估計(jì)能到2000萬人。每天有上億的用戶上淘寶去買東西。淘寶任何一個(gè)規(guī)則的變化,對整個(gè)社會都會有不小的影響。
2012年淘寶、天貓雙十一,整個(gè)交易額達(dá)到191億,考驗(yàn)的不只是淘寶、淘寶賣家、淘寶買家,還有物流快遞公司、銀行支付系統(tǒng)等。試想有一天淘寶忽然停業(yè)一天,全國有多少人都得在家打麻將了。同理,搜索的任何一個(gè)變化,都會影響淘寶賣家,通過賣家會影響到買家、第三方物流……
不知道有多少人還記得2010年7月份搜索規(guī)則的變化,已經(jīng)由一個(gè)公司內(nèi)部的技術(shù)變革,演變成一個(gè)社會事件。這個(gè)在本文后面會有專題介紹。
三、搜索的實(shí)時(shí)性
如果有人自己建了個(gè)網(wǎng)站,網(wǎng)頁搜索引擎要是一兩個(gè)星期沒有收錄這個(gè)網(wǎng)站,站長也不會太著急。但在淘寶上不一樣,必須是實(shí)時(shí)或者接近實(shí)時(shí)的。賣家發(fā)布一個(gè)商品,希望幾分鐘后就能搜索到。因?yàn)樯唐肥菍?shí)體,賣一件少一件,價(jià)格也會有變化,賣家還會經(jīng)常搞活動(dòng),如果信息更新不及時(shí),就會誤導(dǎo)買家,造成糾紛。這些對搜索的實(shí)時(shí)性要求非常高。
在淘寶上,每天會有上億的商品信息發(fā)生變化,包括上架、下架、銷量、價(jià)格、屬性、描述的變化等。這些商品絕大部分都會在幾分鐘之內(nèi)反應(yīng)到搜索結(jié)果中去,如果要做到實(shí)時(shí)的呢? 這對技術(shù)帶來的挑戰(zhàn)是巨大的。淘寶最開始更新的周期是半個(gè)小時(shí)到40分鐘,到2012年已經(jīng)縮短到三四分鐘之內(nèi)了。當(dāng)然,晚上系統(tǒng)做更新的時(shí)候,數(shù)據(jù)更新會稍微慢一些。
四、搜索的查全率
查全率是個(gè)專業(yè)術(shù)語。所謂查全率,就是搜索鞋子,找到的鞋子數(shù)量占總體鞋子數(shù)量的百分比。類似的術(shù)語還有相關(guān)性,相關(guān)性就是指搜索結(jié)果和搜索詞是否相關(guān)。例如:搜索“做自己”,出來《做自己》這本書就算相關(guān),出來《做自己的口才專家》就屬于不相關(guān)。搜索手機(jī),出來手機(jī)鏈也屬于不相關(guān)。
網(wǎng)頁搜索是會做一些消重和過濾的。我們在網(wǎng)頁搜索時(shí),最不希望看見的就是一摸一樣的重復(fù)結(jié)果。在淘寶搜索中,我們也不希望看見太多的重復(fù)結(jié)果,但同時(shí)又希望有不同的商家可以對比,有不同的地域可以選擇。對于賣家來說,如果自己店鋪的寶貝因?yàn)楦渌赇佒貜?fù)而不出現(xiàn)的話,一定會詢問為什么,淘寶的客服電話很快就會打爆了。
淘寶搜索,一方面要考慮買家的體驗(yàn),一方面又要考慮賣家的利益,這就需要采用很多不同的技術(shù)解決。
五、搜索的反作弊
有一項(xiàng)很吃香的職業(yè),叫搜索引擎優(yōu)化(SEO),他們的主要工作就是如何讓制定的結(jié)果在搜索引擎中排名靠前。如果用正常手段,叫SEO,如果用一些欺騙的手段,就叫作弊。網(wǎng)頁搜索和淘寶搜索上作弊的人都非常多,因?yàn)樗阉饕娴闹匾瑢?dǎo)致有太多的利益驅(qū)動(dòng)。雖然都有作弊,但手段很不一樣。
在淘寶搜索上是直接和交易相關(guān),所以作弊更加瘋狂;同時(shí)檢測作弊的對象又是淘寶的賣家,如果算法有誤殺,會導(dǎo)致正常的賣家受到損失,這個(gè)損失經(jīng)常是這個(gè)賣家不可承受的。如何進(jìn)行搜索的反作弊,也是一項(xiàng)很有挑戰(zhàn)的技術(shù)。
阿基米德
淘寶搜索這幾年,最大的變化有兩個(gè),一個(gè)是阿基米德,一個(gè)是個(gè)性化搜索。這是我在負(fù)責(zé)淘寶搜索期間,主導(dǎo)的最重要的兩個(gè)項(xiàng)目。阿基米德的上線,奠定了整個(gè)淘寶搜索的框架,直到現(xiàn)在,搜索的排序算法還是基于當(dāng)時(shí)建立的框架。如果說阿基米德是過去和現(xiàn)在,那么個(gè)性化項(xiàng)目則是淘寶搜索的未來。從2012年開始在個(gè)性化排序和推薦上做了很多工作,2013年也是重點(diǎn)。個(gè)性化以后會有專門的文章來介紹,這里只介紹阿基米德。
2010年7月8日,淘寶搜索新排序算法阿基米德上線。由于排序算法變化大,導(dǎo)致很多賣家的流量波動(dòng)非常大。特別是靠之前規(guī)則獲得很多流量的賣家,這次規(guī)則的調(diào)整,導(dǎo)致他們流量大幅下降,因此很多賣家開始圍攻淘寶。這就是7.8事件。回憶當(dāng)時(shí)的情景,我仍然歷歷在目。
以下內(nèi)容摘選自我在2010年8月發(fā)給所有淘寶內(nèi)部小二的郵件:
Hi 大家好,
想必這段時(shí)間大家從各方渠道都聽到了不少賣家的聲音,有新聞、有論壇、有抗議的、有拉橫幅的,肯定也有賣家直接找到我們小二來詢問,背后到底發(fā)生了什么?搜索規(guī)則的修改真的是像外界說的一樣么?相信每個(gè)小二都有疑惑。
夜深人靜,我來給大家做個(gè)詳細(xì)介紹。
不是前言的背景
以前的搜索,一直是簡單的原則:消保優(yōu)先、相關(guān)性、櫥窗推薦的三大前提下,按照下架時(shí)間排序。
存在的一些不好的現(xiàn)象:
1. 一個(gè)貌似對賣家很公平的原則,從實(shí)際展現(xiàn)數(shù)量和點(diǎn)擊數(shù)量來看,還是被一些針對規(guī)則做了很多優(yōu)化的大賣家把持著;
2. 對于消費(fèi)者也沒有任何公平可言,因?yàn)樽钪匾呐判蛞蛩叵录軙r(shí)間,消費(fèi)者不關(guān)心。消費(fèi)者最關(guān)心的賣家服務(wù)質(zhì)量,卻沒考慮在內(nèi)。
3. 流量浪費(fèi)非常嚴(yán)重,不少賣家每天得到流量很大,但成交比例非常低。有的賣家經(jīng)常每天上千個(gè)搜索點(diǎn)擊流量,只有一到兩單的成交,有的甚至一單都沒有。
4. 很多賣家花很多心思琢磨如何給店鋪增加更多的流量(不排除通過作弊等方式),但通常忽視對于買家的服務(wù)質(zhì)量。
我們希望那些服務(wù)質(zhì)量好的賣家,能自然得到更多的流量。服務(wù)越好,流量增長越多!
我們希望那些得到流量的賣家,如果服務(wù)質(zhì)量不好,流量會越來越低!
我們希望賣家可以花更多的時(shí)間和精力在如何服務(wù)好買家,而不是挖空心思想搞流量!
于是我們有了阿基米德!
什么是阿基米德
2010年,淘寶消費(fèi)者年。
每天是誰在直接接觸消費(fèi)者?不是淘寶幾千名小二,而是淘寶幾百萬的賣家。如果賣家對消費(fèi)者的服務(wù)越來越好了,那么消費(fèi)者的體驗(yàn)會越來越好!
阿基米德,簡單說,就是把“店鋪服務(wù)質(zhì)量”作為重要因素加入到搜索中來影響排序。7月8日上線阿基米德以后,目前的排序規(guī)則是:
消保優(yōu)先、相關(guān)性、櫥窗推薦的三大前提下,在一定時(shí)間范圍內(nèi),按照店鋪服務(wù)質(zhì)量權(quán)重排序。
目前影響店鋪服務(wù)質(zhì)量參考的因素有很多,包括:是否違規(guī)、是否作弊、退款率、超時(shí)退款率、發(fā)貨速度、旺旺響應(yīng)速度、滯銷商品率…….等。參數(shù)有幾十個(gè),只是權(quán)重不一樣。
阿基米德的影響
這次調(diào)整,確實(shí)對賣家的影響比較大,應(yīng)該說是幾家歡喜幾家愁。各方面的新聞報(bào)道,就不計(jì)其數(shù);來淘寶抗議的賣家,也來了幾波了。
這個(gè)情況下,來看看整體數(shù)據(jù):
1 搜索帶來的UV成交轉(zhuǎn)化率至少提升7.942%,搜索結(jié)果點(diǎn)擊率提升4.14%,退款率下降19%
2 今天剛收到BI同學(xué)做的全站對比分析數(shù)據(jù):
全網(wǎng)UV下降明顯
大家都知道6、7、8月是淡季,我不擅長做數(shù)據(jù)分析,但有一點(diǎn)是可以說明的:阿基米德的上線沒起啥壞作用,也并不是很多抵制搜索排序改版的人說的那樣。
這次調(diào)整,對于P4P廣告的收入沖擊很大,上線的第一周,搜索右側(cè)的廣告收入,下降了約10%左右。主要的原因就是因?yàn)橄M(fèi)者使用搜索時(shí)點(diǎn)擊搜索結(jié)果更多 了,點(diǎn)擊廣告更少了。超凡、龍飛、三多對這次變化,表現(xiàn)出了高度的姿態(tài):支持搜索的改變!老陸、三豐、東邪也紛紛表示:不要擔(dān)心收入下降,只要對消費(fèi)者有 更好的體驗(yàn),支持!
加上數(shù)據(jù)的支持,給予搜索部門同事更多的信心!
這次事情對搜索部門的影響就更加深遠(yuǎn)了,在提升消費(fèi)者體驗(yàn)方面,可以在排序上做更多的工作。同時(shí),也可以真正利用排序的變化,來引導(dǎo)賣家的行為!讓搜索排序成為撬動(dòng)賣家行為的支點(diǎn)吧!
—-鬼腳七
2010.8.7
從現(xiàn)在來看當(dāng)時(shí)的目的,已經(jīng)完全達(dá)到了,只是當(dāng)時(shí)有點(diǎn)鬧騰。
好吧,那就是一段故事,都過去了。
為什么會有這么糾結(jié)的地方,思考一下淘寶搜索所處的位置。淘寶搜索的任何變化,需要考慮三方面的因素:買家、賣家、平臺。買家的體驗(yàn)是第一位的,需要平衡眾多賣家的利益,還要考慮平臺的健康發(fā)展。
通過這篇文章的描述,應(yīng)該對淘寶搜索有了大體的印象。不要著急,下次的文章我會專門介紹淘寶搜索系統(tǒng)的原理,逐漸比較技術(shù)。如果有耐心看完這個(gè)搜索系列文章,就算他不能成為搜索專家,一定能對搜索的邏輯非常清楚。
聯(lián)系客服