百度搜索算法大盤點2013-2019-1.網(wǎng)站內(nèi)容質(zhì)量
1.網(wǎng)站內(nèi)容質(zhì)量
1.1 颶風算法2.0——嚴厲打擊惡劣采集行為
百度搜索于2017年7月4日發(fā)布颶風算法,嚴厲打擊惡劣采集問題,并在2018年9月13日公布颶風算法升級為2.0版本。
颶風算法2.0主要打擊以下四類惡劣采集行為:
1.存在大量從其他站點或公眾號等內(nèi)容生產(chǎn)方采集、搬運而來的內(nèi)容,信息未經(jīng)整合,排版混亂,文章可讀性差,有明顯采集痕跡,對用戶無任何增益價值。
問題示例1:文章有明顯采集痕跡
圖片
2.存在多段文章拼接的內(nèi)容,文章邏輯性差,無法滿足用戶需求,閱讀體驗差。
問題示例2:文章內(nèi)容拼接
圖片
3.站點內(nèi)存在大量采集內(nèi)容,網(wǎng)站自身的內(nèi)容生產(chǎn)力極差。
4.站點內(nèi)存在大量與本站主題無關(guān)的采集內(nèi)容,領(lǐng)域?qū)W⒍炔睿瑦阂猥@取流量。例如:科技網(wǎng)站采集大量娛樂八卦、社會新聞等情況。
問題示例3:學習類站點發(fā)布美食類內(nèi)容
圖片
關(guān)于颶風算法的更多信息請參考:
2018.9.20 【官方說法】颶風算法2.0解讀
2018.9.13 百度搜索將推出颶風算法2.0,嚴厲打擊惡劣采集行為
2017.7.4 百度推出颶風算法,嚴厲打擊惡劣采集
1.2 颶風算法3.0——控制跨領(lǐng)域采集及站群問題
百度搜索在2019年8月對颶風算法進行升級,上線颶風算法3.0。
這次算法升級主要針對跨領(lǐng)域采集以及站群問題,將覆蓋百度搜索下的PC站點、H5站點、智能小程序等內(nèi)容。對于算法覆蓋的站點/智能小程序,將會根據(jù)違規(guī)問題的惡劣程度,酌情限制搜索結(jié)果的展現(xiàn)。
以下詳細說明颶風算法3.0的相關(guān)規(guī)則。
一. 跨領(lǐng)域采集:
指站點/智能小程序為了獲取更多流量,發(fā)布不屬于站點/智能小程序領(lǐng)域范圍的內(nèi)容,通常這些內(nèi)容采集自互聯(lián)網(wǎng),內(nèi)容質(zhì)量及相關(guān)性低、對搜索用戶價值低。對于這樣的行為搜索會判定該站點/智能小程序的領(lǐng)域?qū)W⒍炔蛔?,會有不同程度的限制展現(xiàn)。
跨領(lǐng)域采集主要包括下面兩類問題:
第一類:主站或主頁的內(nèi)容/標題/關(guān)鍵詞/摘要等信息顯示該站有明確的領(lǐng)域或行業(yè),但發(fā)布內(nèi)容與該領(lǐng)域不相關(guān),或相關(guān)性較低。
問題示例:美食類智能小程序發(fā)布足球相關(guān)內(nèi)容
圖片
第二類:站點/智能小程序沒有明確的領(lǐng)域或行業(yè),內(nèi)容涉及多個領(lǐng)域或行業(yè),領(lǐng)域模糊、領(lǐng)域?qū)W⒍鹊汀?/p>
問題示例:智能小程序內(nèi)容涉及多個領(lǐng)域
圖片
二. 站群問題:
指批量構(gòu)造多個站點/智能小程序,獲取搜索流量的行為。站群中的站點/智能小程序大多質(zhì)量低、資源稀缺性低、內(nèi)容相似度高、甚至復用相同模板,難以滿足搜索用戶的需求。
問題示例:多個智能小程序復用同一模板,內(nèi)容質(zhì)量低、相似度高
圖片
關(guān)于颶風算法3.0的更多信息請參考:
2019.8.8 颶風算法3.0即將上線,控制跨領(lǐng)域采集及站群問題
2019.8.22 【官方說法】颶風算法3.0解讀
1.3 細雨算法——針對B2B領(lǐng)域的受益行為
2018年6月,百度搜索發(fā)布細雨算法,針對B2B行業(yè)的網(wǎng)站受益問題進行規(guī)范和引導。
細雨算法主要針對以下問題:
1.頁面標題作弊及誤導,主要有下面四類:
(1)非公司官網(wǎng),title中包含“官網(wǎng)”等字樣,誤導搜索用戶認為是官網(wǎng)
問題示例4:
圖片
(2)頁面title中堆砌相近關(guān)鍵詞;
問題示例5:
圖片
(3)頁面title中穿插火星文字或者特殊符號,影響正常閱讀;
問題示例6:
圖片
(4) 頁面title中穿插受益方式。
問題示例7:
圖片
2.頁面正文內(nèi)容中存在受益信息,主要包括以下三類問題:
(1)正文內(nèi)容不完整,頻繁穿插變形的受益方式。
具體是指:正文內(nèi)容為無價值內(nèi)容的拼接或者正文內(nèi)容不完整,同時采用“英文字母”、“漢字諧音”、“特殊符合”、“全角符合”等方式代替聯(lián)系方式,穿插在正文內(nèi)容中。
舉例:5992八⑧⑧⑧
舉例:13800138000
問題示例8:
圖片
(2)文章的配圖圖片中存在受益聯(lián)系方式。
具體是指:圖片中聯(lián)系方式水印面積較大,嚴重損害瀏覽體驗。
問題示例9:
圖片
(3)正文中商品或者服務(wù)信息內(nèi)容為亂采集、拼接而成、排版混亂、用戶從頁面中無法獲得商品或者服務(wù)信息。
問題示例10:
圖片
關(guān)于細雨算法的更多信息請參考:
2018.7.5 【官方說法】B2B領(lǐng)域細雨算法解讀
2018.6.28 百度搜索推出細雨算法 促進供求黃頁類站點生態(tài)健康發(fā)展
1.4 細雨算法2.0——針對B2B領(lǐng)域違規(guī)低質(zhì)內(nèi)容
2019年11月,百度搜索發(fā)布細雨算法2.0,針對B2B行業(yè)的惡劣違規(guī)問題及低質(zhì)內(nèi)容。
細雨算法2.0主要針對以下問題:
一、惡劣違規(guī)內(nèi)容:
1、頁面內(nèi)容惡劣采集。
如:拼接內(nèi)容、純采集內(nèi)容、跨領(lǐng)域采集內(nèi)容等。
問題示例:B2B領(lǐng)域小程序采集時事新聞
2、發(fā)布軟文信息。
問題示例:利用小程序頁面發(fā)布軟文,頁面標題是“垃圾車廠家哪家好“,內(nèi)容是品牌軟文,對用戶產(chǎn)生誤導
3、發(fā)布無法滿足用戶需求的空白頁面,對用戶完全無價值。
問題示例:該小程序頁面為空白頁面
4、商品信息有誤。
如:商品詳情、價格等與實際情況不符
問題示例:商品價格與實際情況不符
5、功能不可用。
如:交易、聯(lián)系電話、查看詳情等交互功能不可用等情況。
二、低質(zhì)內(nèi)容:
1、圖片內(nèi)容低質(zhì)。
如:圖片內(nèi)容與文字描述不一致、圖片嵌入電話號碼、圖片質(zhì)量極低影響閱讀體驗等。
問題示例:圖片中大量嵌入聯(lián)系電話
2、頁面內(nèi)容低質(zhì)。
如:頁面中只有圖片無有效信息,或信息提供不完善等情況。
問題示例:網(wǎng)站僅有圖片作為展示,沒有文字說明
關(guān)于細雨算法2.0的更多信息請參考:
2019.11.15 【官方說法】細雨算法2.0解讀
2019.11.7 針對B2B領(lǐng)域低質(zhì)內(nèi)容,細雨算法即將升級
1.5 勁風算法——針對惡意構(gòu)造聚合頁問題
2020年2月,百度搜索發(fā)布勁風算法,針對惡意構(gòu)造聚合頁面內(nèi)容來獲取搜索排名的行為。
惡劣聚合頁問題主要包括以下四種類型:
1、頁面內(nèi)容與站點本身所屬領(lǐng)域不符,或站點無專注領(lǐng)域,多為采集拼湊內(nèi)容。
問題示例1:站點內(nèi)容領(lǐng)域分散
2、頁面內(nèi)容與標題及頁面中標記的標簽不符。
問題示例2:頁面內(nèi)容與標題不符
3、由網(wǎng)站搜索功能生成的靜態(tài)搜索結(jié)果頁。
問題示例3:靜態(tài)搜索結(jié)果頁
4、空短、無有效信息、失效的聚合頁。
問題示例4:無有效信息的聚合頁
關(guān)于勁風算法的更多信息請參考:
2020.3.5 【官方解讀】勁風算法官方解讀
2020.2.27 勁風算法即將上線
1.6 藍天算法——嚴厲打擊售賣軟文、目錄行為
2016年11月,百度搜索推出藍天算法,持續(xù)打擊新聞類站點售賣軟文、目錄的行為,還用戶一片搜索藍天。被“藍天算法”所覆蓋的站點將會被降低其在百度搜索系統(tǒng)中的評價。
問題示例11:
圖片
關(guān)于藍天算法的更多信息請參考:
2016.11.21 百度推出藍天算法,嚴厲打擊新聞類站點售賣目錄
1.7 極光算法——倡導重視落地頁時間規(guī)范
2018年5月底,百度搜索上線極光算法,旨在倡導資源方重視網(wǎng)站落地頁時間規(guī)范。落地頁時間因子是百度搜索判斷網(wǎng)站收錄、展示、排序結(jié)果的重要參考依據(jù)。
為了讓用戶獲得更滿意的搜索瀏覽體驗,百度給予符合落地頁時間因子要求且時效性較高的網(wǎng)頁更多的收錄、展現(xiàn)機會,同時減少不符合規(guī)定的網(wǎng)站的展現(xiàn)機會。
百度搜索落地頁時間因子規(guī)范
一、前言
落地頁時間因子是百度搜索判斷網(wǎng)站收錄、展示、排序結(jié)果的重要參考依據(jù),百度搜索綜合用戶對落地頁中關(guān)于時間因子的實際感受,發(fā)現(xiàn)目前PC端及移動端大量網(wǎng)站落地頁存在頁面時間標注不清、頁面無時間等對用戶瀏覽體驗不友好行為。為了讓搜索用戶獲得更滿意的搜索瀏覽體驗,我們將給予符合落地頁時間因子要求、且時效性較高的網(wǎng)頁更多的收錄和展現(xiàn)機會,同時對不符合的網(wǎng)站減少展現(xiàn)機會。
為了讓百度搜索的重要合作伙伴——優(yōu)質(zhì)站點免遭損失,百度搜索推出《百度搜索落地頁時間因子規(guī)范》,開放對落地頁時間因子的提取規(guī)范,滿足搜索用戶的瀏覽體驗,同時避免站長造成損失,實現(xiàn)共贏。
二、時間因子提交格式:PC和移動端頁面僅支持JSON-LD格式提交時間因子。
*可復制效果如下:
"pubDate": "2017-06-15T08:00:01",
"upDate": "2017-06-16T01:02:03",
"lrDate": "2017-06-17T09:10:11",
*注意:
1、此代碼與熊掌號后臺中頁面改造所使用jsonld代碼為同一套代碼,如熊掌號頁面改造中已注明時間,無需多次在頁面中備注時間
2、若沒有開通熊掌號,appid可選擇“否”
三、時間因子字段命名:
字段命名
字段說明
字段格式
Pubdate
內(nèi)容發(fā)布時間
YYYY-MM-DDThh:mm:ss的日期時間(請注意日期與時間之前以“T”分隔)
Update
內(nèi)容更新時間
1)如內(nèi)容為首次創(chuàng)建,請?zhí)顚懪cpubdate相同的時間;
2)如頁面是問答、論壇類,請?zhí)顚懹脩艨煽吹降牡谝粋€回答對應(yīng)的時間
lrDate
最新回復時間
1)如頁面是問答、論壇類且有回復信息,請在此字段填寫最新一條回復對應(yīng)的時間
*要求:移動站要求同時提交熊掌號appid,提升時間因子可信度;PC端暫時不要求提交熊掌號appid。
四、頁面提交時間因子規(guī)范:
根據(jù)不同的頁面類型,用戶需要參考的時間不同。以下根據(jù)不同的頁面類型,建議優(yōu)先提交不同的時間。
1、首頁
包含主要網(wǎng)站首頁(如新浪首頁、網(wǎng)易首頁)、分頻道首頁(如新浪體育頻道)等。該類頁面的特征是,具有多種內(nèi)容,多種鏈接,內(nèi)容更新較快,提供最新更新時間即可。
首頁類型
頁面樣式舉例
建議時間
網(wǎng)站首頁
新浪首頁、網(wǎng)易首頁、企業(yè)官網(wǎng)
提供該列表所有內(nèi)容中的最新更新時間(update)
分頻道首頁
新浪體育、網(wǎng)易科技、新浪NBA
2、列表頁
該類頁面與首頁類似,也是具有多種內(nèi)容,多個鏈接,頁面整體更新較快,需要提供最新更新時間。專題頁是一種特殊的列表頁,一般是對同一事件的優(yōu)質(zhì)內(nèi)容聚合頁面,除更新時間外,專題頁的發(fā)布時間也很重要。
列表頁類型
頁面樣式舉例
建議時間
小說/視頻 封面頁
斗破蒼穹、急診科醫(yī)生
提供該列表所有內(nèi)容中的最新更新時間(update);
如果有發(fā)布時間,建議補充專題頁發(fā)布時間(pubdate);
*更新時間(update)為必填時間
搜索/篩選結(jié)果頁
58狗糧篩選、京東s8篩選
貼吧/blog/直播等個人首頁
直播個人首頁、吧首頁
專題頁
十九大專題
3、詳情頁
該類頁面主要是內(nèi)容型頁面,包括文章詳情頁、視頻播放頁、小說章節(jié)內(nèi)容詳情頁等,這類頁面在發(fā)布后,大部分更新較少,用戶主要關(guān)注發(fā)布時間。
問答、論壇等具有交互的詳情頁比較特殊,需要提供更多的內(nèi)容,詳見下表。
詳情面類型
頁面樣式舉例
建議時間
文章詳情頁
新聞文章、菜譜介紹
優(yōu)先提供內(nèi)容的發(fā)布時間(pubdate)
如果內(nèi)容有更新,需補充內(nèi)容更新時間(update)
*發(fā)布時間(pubdate)為必填時間;時間精確到分鐘級
視頻播放頁
急診科醫(yī)生
商品/產(chǎn)品/黃頁/供求頁
商品、供求頁
公司介紹頁
公司介紹頁面、公司信息
問答詳情頁面
有問有答的詳情頁,如:百度知道、知乎問答
提供問題發(fā)布時間(pubdate)
第一個用戶可看到的回答時間(update)
最新回答時間(lrDate)
*三個時間都為必填時間
論壇詳情頁面
論壇帖子頁,如,貼吧、天涯等
提供帖子發(fā)布時間(pubdate)
第一個用戶可看到的回帖時間(update)
最新回帖時間(lrDate)
*三個時間都為必填時間
關(guān)于極光算法的更多信息請參考:
2018.5.7 百度搜索落地頁時間因子規(guī)范
2018.5.31 百度搜索上線極光算法 倡導重視落地頁時間規(guī)范
目錄
1.網(wǎng)站內(nèi)容質(zhì)量
2.用戶需求滿足
3.搜索惡意競爭
4.網(wǎng)站安全問題
5.落地頁體驗問題
來源:百度搜索資源平臺 百度搜索學堂