移動(dòng)搜索-3-良好收錄
獲得流量的基礎(chǔ)——良好收錄
搜索引擎作為網(wǎng)站的普通訪客,對(duì)網(wǎng)站的抓取索引、對(duì)站點(diǎn)/頁面的價(jià)值判定以及排序,都是從用戶體驗(yàn)出發(fā)。因此,原則上網(wǎng)站任何對(duì)用戶體驗(yàn)的改進(jìn),都是對(duì)搜索引擎的改進(jìn)。但是限于當(dāng)前整體的網(wǎng)絡(luò)環(huán)境以及技術(shù)性原因,落實(shí)用戶體驗(yàn)的具體手段也是需要考慮對(duì)搜索引擎友好性的,使之在滿足用戶體驗(yàn)的前提下也會(huì)讓搜索引擎更易理解處理。那么,面向移動(dòng)搜索引擎的網(wǎng)站建設(shè),主要分為三個(gè)部分:如何更好的讓百度移動(dòng)搜索收錄網(wǎng)站中的內(nèi)容、如何在移動(dòng)搜索中獲得更好的排名、如何讓用戶從眾多的搜索結(jié)果中快速地找到并點(diǎn)擊你的網(wǎng)站。簡單來說,就是收錄、排序、展現(xiàn)。下面我們將從收錄開始介紹:
機(jī)器可讀:
與PC spider一樣,百度通過一個(gè)叫Baiduspider2.0的程序抓取移動(dòng)互聯(lián)網(wǎng)上的網(wǎng)頁,經(jīng)過處理后建入移動(dòng)索引中。當(dāng)前Baiduspider只能讀懂文本內(nèi)容,flash、圖片等非文本內(nèi)容暫時(shí)不能很好處理,放置在flash、圖片中的文字,百度只能簡單識(shí)別。建議使用文本而不是flash、圖片、Javascript等來顯示重要的內(nèi)容或鏈接,搜索引擎暫時(shí)無法識(shí)別Flash、圖片、復(fù)雜Javascript中的內(nèi)容;同時(shí)僅存在于flash、Javascript中包含鏈接指向的網(wǎng)頁,百度移動(dòng)搜索同樣可能無法收錄。不要在希望搜索引擎可讀的地方使用Ajax技術(shù),比如標(biāo)題、導(dǎo)航、內(nèi)容等等。
結(jié)構(gòu)扁平:
移動(dòng)站點(diǎn)同樣應(yīng)該有清晰的結(jié)構(gòu)以及更淺的鏈接深度,這能夠使用戶快速地獲取有用信息,也能使搜索引擎快速理解網(wǎng)站中的每一個(gè)頁面所處的結(jié)構(gòu)層次。網(wǎng)站結(jié)構(gòu)建議采用樹型結(jié)構(gòu),樹型結(jié)構(gòu)通常分為以下三個(gè)層級(jí):首頁——頻道——詳情頁。
網(wǎng)狀鏈接:
理想的網(wǎng)站結(jié)構(gòu)是樹型扁平,從首頁到內(nèi)容頁的層級(jí)盡量少,這樣更有利于搜索引擎進(jìn)行處理。同時(shí),網(wǎng)站內(nèi)的鏈接也應(yīng)該采用網(wǎng)狀結(jié)構(gòu),網(wǎng)站上每個(gè)網(wǎng)頁都要有指向上、下級(jí)網(wǎng)頁以及相關(guān)內(nèi)容的鏈接,避免出現(xiàn)鏈接孤島:首頁有到頻道頁的鏈接,頻道頁有到首頁和普通內(nèi)容頁的鏈接、普通內(nèi)容頁有到上級(jí)頻道以及首頁的鏈接、內(nèi)容相關(guān)的網(wǎng)頁間互相有鏈接。網(wǎng)站中每一個(gè)網(wǎng)頁,都應(yīng)該是網(wǎng)站結(jié)構(gòu)的一部分,都應(yīng)該能通過其他網(wǎng)頁鏈接到,這樣才能使baiduspider盡可能全地遍歷網(wǎng)站內(nèi)容。同時(shí),重要內(nèi)容應(yīng)該距離首頁更近,有利于價(jià)值傳遞。
簡單易懂的URL:
具有良好描述性、規(guī)范、簡單的URL,有利于用戶更方便地記憶和直觀判斷網(wǎng)頁內(nèi)容,也有利于搜索引擎更有效地抓取和理解網(wǎng)頁。網(wǎng)站設(shè)計(jì)之初,就應(yīng)該有合理的URL規(guī)劃。我們認(rèn)為:
1、對(duì)于移動(dòng)站首頁一般采用m.a.com/3g.a.com/wap.a.com;
2、頻道頁采用m.a.com/n1/、m.a.com/n2/(其對(duì)應(yīng)于PC站點(diǎn)的頻道n2.a.com),當(dāng)然,n1、n2直接可讀更佳;
3、詳情頁的URL盡量短,減少無效參數(shù),例如統(tǒng)計(jì)參數(shù)等,保證同一頁面只有一套URL地址,不同形式的URL301跳轉(zhuǎn)到正常URL上;
4、Robots封禁baiduspider抓取您不想展示給用戶的URL形式以及不愿被百度抓取的私密數(shù)據(jù)。
涵蓋主旨的anchor:
anchor即錨文本,對(duì)一個(gè)鏈接的描述性文字,錨文本寫得越簡潔明確,用戶越易明白該指向網(wǎng)頁的主旨內(nèi)容。用戶發(fā)現(xiàn)你的網(wǎng)頁是從其他網(wǎng)頁上的鏈接,錨文本是該網(wǎng)頁的唯一介紹。跟普通用戶相同,搜索引擎spider在剛發(fā)現(xiàn)一個(gè)網(wǎng)頁時(shí),錨文本也是對(duì)該頁面理解的唯一因素,同時(shí)對(duì)于最終的排序起到具有一定的作用。
工具“移動(dòng)sitemap”:
百度站長平臺(tái)提供了移動(dòng)sitemap提交工具,通過提交sitemap,可以使百度更快更全地抓取收錄網(wǎng)站內(nèi)容。
工具“移動(dòng)索引量”:
百度站長平臺(tái)同時(shí)提供了移動(dòng)索引量工具,可以使站長及時(shí)了解到自己網(wǎng)站在移動(dòng)端的收錄情況。
工具“移動(dòng)死鏈提交”:
百度站長平臺(tái)還提供了移動(dòng)死鏈提交工具,通過提交死鏈sitemap,可以使百度更快地發(fā)現(xiàn)網(wǎng)站死鏈進(jìn)行更新刪除。
合理的返回碼:
百度spider在進(jìn)行抓取和處理時(shí),是根據(jù)http 協(xié)議規(guī)范來設(shè)置相應(yīng)邏輯的,常用的幾個(gè)返回碼如下:
404,百度會(huì)認(rèn)為網(wǎng)頁已失效已刪除,通常在索引中刪除,短期內(nèi)spider再次遇到也不會(huì)抓取。建議內(nèi)容刪除、網(wǎng)頁失效等的情況下使用404返回碼,告知百度spider該頁面已失效。同時(shí)網(wǎng)站中盡量減少死鏈的累計(jì)。如果網(wǎng)站臨時(shí)關(guān)閉或抓取壓力過大,不要直接返回404,使用503。
301,永久性重定向,百度會(huì)認(rèn)為當(dāng)前URL永久跳轉(zhuǎn)至新URL。當(dāng)網(wǎng)站改版、更換域名等情況下,建議使用301,同時(shí)配合使用站長平臺(tái)的網(wǎng)站改版工具。
503,百度會(huì)認(rèn)為臨時(shí)不可訪問,不會(huì)直接刪除,短期內(nèi)再來檢查幾次。如果網(wǎng)站臨時(shí)性關(guān)閉建議使用503。
移動(dòng)網(wǎng)站建設(shè)常見問題
移動(dòng)網(wǎng)站興起時(shí)間不長,站長有很多相似的問題。在2014年11月份的百度移動(dòng)搜索沙龍上,移動(dòng)專家針對(duì)站長提問較多的問題進(jìn)行了統(tǒng)一回答,與往期沙龍的零星回答合并整理如下:
問:我的移動(dòng)站內(nèi)容和PC站是一樣的,這樣需不需要屏蔽百度的PC搜索蜘蛛?
答:由于百度的PC搜索和移動(dòng)搜索共用同一個(gè)spider,都帶有baidu標(biāo)示,不要進(jìn)行屏蔽。Spider在抓取時(shí)會(huì)對(duì)頁面進(jìn)行識(shí)別,自動(dòng)判斷是PC頁還是mobile頁,因此建議站長使用規(guī)范的html5/xhtml協(xié)議語言來建設(shè)移動(dòng)站。
問:手機(jī)站使用xhtml與html5開發(fā),對(duì)搜索引擎是否有區(qū)別?
答:大家使用手機(jī)搜索時(shí)會(huì)發(fā)現(xiàn)用2G的情況下移動(dòng)搜索會(huì)給你到極速版,就是保證你得到結(jié)果的速度足夠快,但是結(jié)果樣式比較簡單。一般情況下極速版我們會(huì)優(yōu)先給Xhtml的結(jié)果,觸屏版優(yōu)先給html5,效果更加炫酷。
問:如果是URL、PC訪問和移動(dòng)訪問分別識(shí)別不同的模版,例如我們有一個(gè)URL,PC訪問是是這個(gè)模版,手機(jī)訪問是那個(gè)模版。那么我們是使用相同的URL好,還是單獨(dú)的做一個(gè)M站好?
答:理想狀態(tài)下同一套u(yù)rl是最優(yōu)的。目前受限于機(jī)制問題,還有待進(jìn)一步解決,預(yù)期14年底能夠完成。目前仍然建議大家移動(dòng)站使用單獨(dú)的m鏈接。同時(shí),暫時(shí)不要使用類似這樣的url: http://m.site.com?src=http://www.site.com 。
問:感謝,我們是這樣理解吧,未來的話如果以用戶習(xí)慣來說,是同一個(gè)URL好?
答:理想的技術(shù)角度看,是同一個(gè)url更好,但是目前盡量仍然使用單獨(dú)的m鏈接。
問:一個(gè)站點(diǎn)有M站和PC站,采用完全相同的TDK,是否有問題,手機(jī)站的SEO規(guī)則是否跟PC站相同?
答:TDK代表標(biāo)題、摘要、關(guān)鍵詞是吧?先理解一下。是這樣的,PC端和移動(dòng)端搜索結(jié)果展現(xiàn)標(biāo)題和摘要的字?jǐn)?shù)限制等都是不同的,PC端30多個(gè)中文漢字才截?cái)?,移?dòng)端不到20個(gè)就折行了,20多個(gè)就省略看不到了。所以,建議移動(dòng)站使用單獨(dú)的TDK。
問:如果兩個(gè)站點(diǎn)它的TDK都是完全相同的,每一個(gè)頁面,會(huì)不會(huì)導(dǎo)致站點(diǎn)被懲罰?
答:這里說的兩個(gè)站如果指同一個(gè)站點(diǎn)的PC和移動(dòng),肯定是不會(huì)導(dǎo)致被懲罰的。
問:外鏈對(duì)手機(jī)站是否有效果?
答:外鏈還是有效果的,但不要做那些垃圾外鏈,比如說論壇的標(biāo)簽里面或者說買賣鏈接或者是說批量的發(fā)鏈接有可能被懲罰。正常交換一下鏈接是有幫助的。0和1是明顯不同的。
問:百度移動(dòng)搜索對(duì)我的移動(dòng)站收錄較少,該如何做?
答:1. 如果您同時(shí)具有PC站,且PC與移動(dòng)站是一一對(duì)應(yīng)的關(guān)系,請(qǐng)利用開放適配工具進(jìn)行提交,既可以幫助移動(dòng)站的收錄又可以幫助您將PC站的排名轉(zhuǎn)移至移動(dòng)搜索; 2. 如果您只有移動(dòng)站,也可以通過我們的移動(dòng)sitemap工具向百度進(jìn)行提交。
結(jié)合實(shí)際情況選擇鏈接提交方式
站長平臺(tái)官方提供的鏈接提交方式如下,我們看看它的說明和對(duì)比,并合理利用這些提交方式,相互之間形成互補(bǔ)。
1、主動(dòng)推送(實(shí)時(shí)):最為快速的提交方式,站點(diǎn)當(dāng)天新產(chǎn)生的鏈接可以通過此方式實(shí)時(shí)、主動(dòng)推送給百度,以保證新鏈接可以及時(shí)被百度收錄,推薦使用。
2、自動(dòng)推送:最為便捷的提交方式,將自動(dòng)推送的JS代碼部署在站點(diǎn)的每一個(gè)頁面源代碼中,部署此代碼的頁面在每次被瀏覽時(shí),鏈接將會(huì)被自動(dòng)推送給百度??梢耘c主動(dòng)推送配合使用。
3、sitemap:您可以定期將網(wǎng)站鏈接放到sitemap中,然后將sitemap提交給百度。百度會(huì)周期性的抓取檢查您提交的sitemap,對(duì)其中的鏈接進(jìn)行處理,但收錄速度慢于主動(dòng)推送。
4、手動(dòng)提交:一次性提交鏈接給百度,對(duì)于少量頁面提交可以使用此種方式。
一:合理使用主動(dòng)推送工具,帶來的好處有以下幾個(gè)方面:
1:及時(shí)被百度發(fā)現(xiàn),可以縮短百度爬蟲發(fā)現(xiàn)您站點(diǎn)新鏈接的時(shí)間,使新發(fā)布的頁面可以在第一時(shí)間被百度收錄,經(jīng)過測(cè)試,用這個(gè)方式提交頁面,基本上可以在幾分鐘內(nèi)被百度發(fā)現(xiàn);
2:保護(hù)原創(chuàng),對(duì)于網(wǎng)站的最新原創(chuàng)內(nèi)容,使用主動(dòng)推送功能可以快速通知到百度,使內(nèi)容可以在轉(zhuǎn)發(fā)之前被百度發(fā)現(xiàn),這點(diǎn)對(duì)于廣大中小站長來說比較重要。
3:節(jié)省帶寬,減少服務(wù)器壓力,因?yàn)槊看翁峤坏捻撁鏀?shù)量有限。
在瞬息萬變的互聯(lián)網(wǎng)中,1微秒決定勝負(fù),本人總結(jié)以下幾點(diǎn)經(jīng)驗(yàn),即可以讓百度更快地收錄頁面,也能節(jié)省帶寬,希望能幫到同學(xué)們。主動(dòng)推送方法如下:
首先進(jìn)入百度站長后臺(tái),在鏈接提交中獲取你的準(zhǔn)入密鑰,具體推送示例在站長后臺(tái)里面已有詳細(xì)說明了,這我就不再重復(fù)了,下面我就舉例在什么時(shí)候進(jìn)行推送提交。
以PHP為例,先建一個(gè)類,當(dāng)然你可以建一個(gè)JS代碼,同樣觸發(fā)調(diào)動(dòng)。
function post_site ($url){
$urls =array($url);
$api ='http://data.zz.baidu.com/urls?site=您的網(wǎng)址&token=【準(zhǔn)入密鑰】&type=original';
$ch = curl_init();
$options = array(
CURLOPT_URL => $api,
CURLOPT_POST => true,
CURLOPT_RETURNTRANSFER => true,
CURLOPT_POSTFIELDS =>implode("\n", $urls),
CURLOPT_HTTPHEADER =>array('Content-Type: text/plain'),
);
curl_setopt_array($ch,$options);
$result =curl_exec($ch);
return $result;
}
成功返回示例:
{
"remain":4999998,
"success":2,
}
Remain代表您可以發(fā)的條數(shù),success代表你發(fā)布成數(shù)的數(shù)量。當(dāng)然您可以建一個(gè)數(shù)據(jù)庫表,把成提交日志記錄下來進(jìn)行監(jiān)控。
現(xiàn)在你可以在生成頁面的過程中進(jìn)行調(diào)動(dòng)了。你可以選擇在生成HTML靜態(tài)頁面時(shí)實(shí)時(shí)推送,只要你把生成的正確URL post_ping($url)即可。如果你的頁面不是生成靜態(tài)頁面的,你可以在審核時(shí),或者發(fā)布時(shí),直接觸發(fā)調(diào)動(dòng),同樣可以輕松快速地推送給百度。這樣百度跳過了正常抓取時(shí)的好幾個(gè)步驟,收錄當(dāng)然快了。
您也要對(duì)收錄的進(jìn)度進(jìn)行監(jiān)控。主動(dòng)推送的數(shù)據(jù)隔天就能看到了,你如果記錄了當(dāng)天推送的數(shù)量,進(jìn)行一個(gè)對(duì)比,就知道推送成功了多少,也可以使用sitemap補(bǔ)全數(shù)據(jù)。
注意事項(xiàng):推送的頁面必須要能打開。使用這個(gè)工具時(shí)要注意,老的、低質(zhì)量的網(wǎng)頁鏈接不要推送了。
二.利用sitemap補(bǔ)全數(shù)據(jù)
Sitemap提交方式是定期將網(wǎng)站鏈接放到sitemap中,然后將sitemap提交給百度。
使用主動(dòng)推送,可以讓百度更快地發(fā)現(xiàn)您的網(wǎng)頁,但也要預(yù)防因?yàn)榫W(wǎng)絡(luò)延時(shí)、DNS錯(cuò)誤、服務(wù)器壓力等因素,造成蜘蛛不能順利抓取到頁面,我們就可以使用sitemap補(bǔ)全數(shù)據(jù),定期在服務(wù)器壓力比較小的時(shí)候,生成sitemap,再推送一次,這樣就萬無一失了。
另外兩種推送方式,自動(dòng)推送和手動(dòng)推送,自動(dòng)推送只要在網(wǎng)站添加站長平臺(tái)提供的js代碼就基本能實(shí)現(xiàn)了,這個(gè)也無須怎樣操作了,而手動(dòng)推送,只適合新手,因?yàn)橹灰裊RL直接復(fù)制性表單提交就可以了。
來源:百度搜索資源平臺(tái) 百度搜索學(xué)堂