本文比較適用與中大型網(wǎng)站的SEO人員,小網(wǎng)站也可以參考,先說(shuō)明兩點(diǎn)
目的在于探討一種挖掘網(wǎng)站的內(nèi)容潛力,把網(wǎng)站中用戶(hù)可能會(huì)關(guān)心的內(nèi)容呈現(xiàn)給用戶(hù),滿(mǎn)足其需求,獲取相應(yīng)的SEO流量。
很多大型網(wǎng)站都在用的一種方法,但是很少有人出來(lái)詳詳細(xì)細(xì)的解釋。
這樣的SEO流量是如何獲得的,下面舉一個(gè)通俗易懂的例子。
假設(shè)我在百度上搜索“iOS 英雄無(wú)敵3”,目的是找一個(gè)能在iOS下運(yùn)行的英雄無(wú)敵3這個(gè)游戲。
事實(shí)上這個(gè)游戲并不存在。因此壓根不存在一個(gè)頁(yè)面可以讓我找到我想要的內(nèi)容(如果有也是標(biāo)題黨)
于是我進(jìn)入了tgbus的這個(gè)關(guān)于iOS 英雄無(wú)敵3的頁(yè)面。
我在這個(gè)頁(yè)面上找到了iOS上的英雄無(wú)敵2這個(gè)游戲以及其他類(lèi)似英雄無(wú)敵3的iOS游戲,以及一些奇奇怪怪的新聞(ok,這個(gè)頁(yè)面做得并不是很容易閱讀)
Finally,我在tgbus上下載了英雄無(wú)敵2的iOS版本試試。
OK,我們?cè)贀Q個(gè)實(shí)際生活中例子:
一個(gè)姑娘去買(mǎi)衣服,于是看上一條粉紅色的連衣裙,但是沒(méi)她要的尺碼。
這時(shí)候營(yíng)業(yè)員會(huì)怎么做,沒(méi)錯(cuò),推薦一些類(lèi)似顏色or款式的連衣裙,并且有碼。
(TGBUS似乎推薦出了一條牛仔褲。)
SO,我們應(yīng)該如何去找出用戶(hù)想要的連衣裙和我們倉(cāng)庫(kù)中有的連衣裙,并且在最恰當(dāng)?shù)臅r(shí)候給用戶(hù)最好的結(jié)果,還能獲取到SEO流量,這并不是一件很簡(jiǎn)單的事情。
Wait,這不是就一個(gè)推薦引擎么?這么復(fù)雜的玩意交給工程師做就行了。事實(shí)上多數(shù)時(shí)候,這只是SEO們一廂情愿的東西,工程師才不會(huì)來(lái)鳥(niǎo)你什么推薦引擎,我們先從一個(gè)可執(zhí)行的角度,自力更生來(lái)把這個(gè)SEO方法實(shí)施下去。
二.內(nèi)容分析,關(guān)鍵詞分析,數(shù)據(jù)接口設(shè)計(jì)
內(nèi)容分析
一個(gè)SEO知道自己網(wǎng)站有多少內(nèi)容很重要,經(jīng)常遇到和人說(shuō):“你網(wǎng)站這個(gè)XX頁(yè)面有問(wèn)題” “???這是什么頁(yè)面啊,我從來(lái)沒(méi)見(jiàn)過(guò)。”
一般一個(gè)網(wǎng)站垂直去分,有首頁(yè),內(nèi)容頁(yè),列表頁(yè)。
內(nèi)容頁(yè)中,又可能分圖片頁(yè),評(píng)論頁(yè),文章分頁(yè)等等
列表頁(yè)中,又可能分頻道頁(yè),產(chǎn)品列表頁(yè),索引頁(yè),專(zhuān)題頁(yè)等等。
一般一套頁(yè)面對(duì)應(yīng)一套甚至多套php模板。
需要弄清楚這些模板是否在一個(gè)架構(gòu)內(nèi),是否公用數(shù)據(jù)庫(kù),頁(yè)面上使用了哪些字段,最好可以找到對(duì)應(yīng)模板的開(kāi)發(fā)人,如果有條件申請(qǐng)到源代碼查看權(quán)限,可以自己看一下。一個(gè)內(nèi)容聚合的需求可實(shí)現(xiàn)度很大程度上取決于上面這些內(nèi)容,先弄清楚把配料都弄齊全了,再開(kāi)始做菜,否則巧婦難為無(wú)米之炊。
橫向去分可能是更多往business方向考慮,比如有我們有賣(mài)線(xiàn)路的,賣(mài)門(mén)票的,賣(mài)酒店的,攻略,用戶(hù)圖片,論壇帖子等等各個(gè)頻道,各個(gè)頻道可能是由不同的部門(mén)在負(fù)責(zé)。哪些是網(wǎng)站熱賣(mài)的,需要熱推(至少你做個(gè)SEO的東西得有商業(yè)價(jià)值,在電商公司非常重要),包括各個(gè)頻道是否有人還在運(yùn)營(yíng),一個(gè)常年無(wú)人打理的頻道,顯然不是一個(gè)好的內(nèi)容源。一般來(lái)說(shuō),主要的產(chǎn)品線(xiàn),和UGC的內(nèi)容一般是網(wǎng)站內(nèi)容提供主力。如果我們想挖掘用戶(hù)需求,也可以?xún)?yōu)先考慮它們。
這個(gè)步驟需要花很多時(shí)間,復(fù)雜一些網(wǎng)站甚至要1個(gè)月才能弄清楚網(wǎng)站到底有多少類(lèi)型的頁(yè)面。在弄清楚上面的問(wèn)題之后,
接下來(lái),就需要只要知道各類(lèi)內(nèi)容有多少數(shù)量。
比如多少個(gè)SKU,多少文章,多少帖子,多少tags,多少分類(lèi)等等
這是很多人在做類(lèi)似工作時(shí)考慮不周全的,憑感覺(jué)去做。最后做出來(lái)一大堆重復(fù)內(nèi)容的頁(yè)面,重復(fù)頁(yè)面對(duì)SEO有多壞的影響就不用再提了。
這個(gè)統(tǒng)計(jì)內(nèi)容數(shù)量的辦法(從好到壞排序)。
1.讀數(shù)據(jù)庫(kù)
2.通過(guò)一些”巧妙”的辦法去數(shù)
3.用工具抓
4.靠經(jīng)驗(yàn)猜(基本不靠譜)
讀數(shù)據(jù)庫(kù)是最簡(jiǎn)單,也是最準(zhǔn)確的辦法了,一個(gè)select完事。
如果沒(méi)有數(shù)據(jù)庫(kù)權(quán)限,就要去想辦法知道。比如文章有多少條,
那可以計(jì)算分頁(yè)數(shù)量*每頁(yè)文章數(shù)量來(lái)統(tǒng)計(jì)
如果是自增id,那來(lái)湊自增id來(lái)數(shù)
如果是固定格式數(shù)據(jù),比如來(lái)北京的圖片,北京的天氣,地區(qū)數(shù)量*類(lèi)型來(lái)計(jì)算,等等
通過(guò)工具抓是很多seo的夢(mèng)想,無(wú)數(shù)人問(wèn)過(guò)這樣的問(wèn)題,有沒(méi)有什么工具可以統(tǒng)計(jì)出我網(wǎng)站有多少網(wǎng)頁(yè)啊。
抱歉,還真沒(méi)有,由于種種網(wǎng)站原因,沒(méi)有任何一個(gè)工具可以統(tǒng)計(jì)出一個(gè)中大型網(wǎng)站到底有多少網(wǎng)頁(yè)(誰(shuí)有那這個(gè)工具比google,百度爬蟲(chóng)還NB),太多的爬蟲(chóng)陷阱,阻礙深入抓取的東西了。當(dāng)然,這樣的抓取工具并不是一無(wú)是處,對(duì)于小型網(wǎng)站,或者特定頻道,甚至特定區(qū)塊的抓取,還是有一定作用的。比如Httrack,Xeun,當(dāng)然還有我比較喜歡用的火車(chē)頭。python,shell等腳本語(yǔ)言一直是萬(wàn)能的。
對(duì)于分庫(kù)分表的超大型站,我也沒(méi)有經(jīng)驗(yàn)應(yīng)該怎么做,但是我覺(jué)得和數(shù)據(jù)庫(kù)管理員搞好關(guān)系他可能會(huì)幫到你,畢竟人家才是專(zhuān)家。
上面基本就是內(nèi)容分析的大致情況了,弄清楚內(nèi)容的種類(lèi),數(shù)量和運(yùn)營(yíng)情況,對(duì)SEO是有很多好處的。
關(guān)鍵詞分析
關(guān)鍵詞分析我一般從3個(gè)角度去考慮。
1.搜索量,其實(shí)這個(gè)指標(biāo)是最不重要的,但是確實(shí)是大家最關(guān)心的指標(biāo),所以我先放第一個(gè)說(shuō)。大部分到訪(fǎng)關(guān)鍵詞的搜索量都是很低的。我舉個(gè)例子看一下。
選取了某頻道月訪(fǎng)問(wèn)量低于30次的關(guān)鍵詞,平均下來(lái)就是一天只能帶來(lái)一次訪(fǎng)問(wèn)的關(guān)鍵詞,是163k左右的訪(fǎng)問(wèn)量
選取了月訪(fǎng)問(wèn)量高于30次的關(guān)鍵詞,平均下來(lái)就是一天只能帶來(lái)一次訪(fǎng)問(wèn)的關(guān)鍵詞,是145k左右的訪(fǎng)問(wèn)量
連續(xù)觀察這組數(shù)據(jù)我們可以看到如下結(jié)論
一個(gè)月能帶來(lái)1000訪(fǎng)問(wèn)量的關(guān)鍵詞,平均到每日也僅有30多左右,這個(gè)頻道的平均CTR大概在10%左右,那每日的搜索量也僅有300,不知道讀者能看懂我的意思沒(méi),搜索量并沒(méi)有想象中那么重要。
2.相關(guān)性,這個(gè)相關(guān)性又分兩個(gè)方面,1是關(guān)鍵詞之間如何把有相關(guān)性的東西提取出來(lái),學(xué)術(shù)一點(diǎn)的概念叫做聚類(lèi),2是關(guān)鍵詞和內(nèi)容之間如何建立相關(guān)性。
先說(shuō)說(shuō)為什么要把有相關(guān)性的關(guān)鍵詞提取出來(lái),1是便于分析用戶(hù)的興趣點(diǎn),以小見(jiàn)大。2是查找重復(fù)/類(lèi)似的關(guān)鍵詞。說(shuō)個(gè)常見(jiàn)的外貿(mào)行業(yè)的SEO手法,往zencart或者magento里面導(dǎo)入幾百萬(wàn)的關(guān)鍵詞,然后再站內(nèi)搜索中搜索產(chǎn)品,生成幾百萬(wàn)個(gè)頁(yè)面來(lái)獲取SEO流量,思路是正確,但是做法太粗糙,往往生成的幾百萬(wàn)頁(yè)面中只有幾百個(gè)頁(yè)面能獲取到流量。我們來(lái)看看下面一些關(guān)鍵詞
”
去北京玩多少錢(qián)
北京玩多少錢(qián)
北京玩幾錢(qián)
北京玩要多少錢(qián)
…
”
這些關(guān)鍵詞講述的意思是一樣的,完全沒(méi)有必要制造多個(gè)頁(yè)面.
3.商業(yè)價(jià)值
三.關(guān)鍵詞挖掘,清洗與過(guò)濾
關(guān)鍵詞的挖掘說(shuō)難不難,說(shuō)簡(jiǎn)單也不簡(jiǎn)單。
基本每個(gè)人都會(huì)問(wèn),怎么挖掘關(guān)鍵詞制作詞庫(kù)。先說(shuō)說(shuō)一些常用的手法。
1.baidu/google API
2.采集愛(ài)站,chinaz,伯樂(lè)等數(shù)據(jù)
3.采集百度下拉框(其他搜索引擎同理)
4.采集百度相關(guān)搜索(其他搜索引擎同理)
5.站內(nèi)搜索和自然流量關(guān)鍵詞
6.現(xiàn)成字典/詞庫(kù)
講點(diǎn)具體實(shí)現(xiàn)的一些注意點(diǎn),都是在實(shí)踐過(guò)程中總結(jié)出來(lái)的東西。方法說(shuō)了,基本10個(gè)人里面有1個(gè)人去實(shí)踐一些就不錯(cuò)了
1.百度和google的api是要申請(qǐng)的,想辦法搞一個(gè),如果沒(méi)有,只能用百度網(wǎng)頁(yè)級(jí)別的采集,百度競(jìng)價(jià)后臺(tái)經(jīng)常改,所以不是很穩(wěn)定,這邊友情推薦一個(gè)工具h(yuǎn)ttp://www.lingdonge.com/(暫時(shí)備案中可能打不開(kāi)),作者很nb,搞俠客站群軟件的。百度API的python的SOAP通信有BUG,連不上(可能我水平太低了T_T),PHP會(huì)SOAP通信的話(huà)可以自己寫(xiě)腳本來(lái)跑,Google的沒(méi)玩過(guò),應(yīng)該差不多
2.API是有精確搜索量的數(shù)據(jù),所以是詞庫(kù)第一數(shù)據(jù)來(lái)源
3.百度下拉框反采集做的比較少,采集地址為http://suggestion.baidu.com/su?wd=xxxxxxxxx+一堆參數(shù)的,具體調(diào)整一下,一個(gè)小腳本可以搞定,但是數(shù)據(jù)深度有限,一般采集2輪后就不用再采了,基本采不出新數(shù)據(jù)了
4.相關(guān)搜索可以用火車(chē)頭或者飛達(dá)魯金花之類(lèi)的,因?yàn)槭遣杉疭ERP,反采集這塊要想辦法繞過(guò)
5.站內(nèi)搜索和自然流量關(guān)鍵詞去GA搞一下就行,批量導(dǎo)出不說(shuō)了。很簡(jiǎn)單,不是用的GA可能會(huì)悲劇一些。
6.拼音輸入法詞庫(kù),推薦一個(gè)數(shù)據(jù)網(wǎng)站http://www.datatang.com/,可以看看,里面會(huì)有一些行業(yè)詞庫(kù)
7.一些特殊的搜索引擎,淘寶,youku之類(lèi),他們也積攢了大量的數(shù)據(jù)信息
四.分詞/檢索/排序/修正
五.頻道的運(yùn)營(yíng),維護(hù),拓展
六.數(shù)據(jù)監(jiān)控
聯(lián)系客服