百度搜索算法規(guī)范詳解-1.頁面內(nèi)容質(zhì)量
1.頁面內(nèi)容質(zhì)量
1.1 颶風算法 3.0 ——針對頁面內(nèi)容質(zhì)量問題
百度搜索于2017年7月4日發(fā)布颶風算法,嚴厲打擊惡劣采集問題,在2018年9月13日公布颶風算法升級為2.0版本,在2019年8月對颶風算法進行升級,上線颶風算法3.0。
颶風算法主要針對以下頁面內(nèi)容質(zhì)量問題:
1.1.1 惡劣采集行為:
(1)存在大量從其他站點、智能小程序或公眾號等內(nèi)容生產(chǎn)方采集、搬運而來的內(nèi)容,信息未經(jīng)整合,排版混亂,文章可讀性差,有明顯采集痕跡,對用戶無任何增益價值。
問題示例1:文章有明顯采集痕跡
(2)存在多段文章拼接的內(nèi)容,文章邏輯性差,無法滿足用戶需求,閱讀體驗差。
問題示例2:文章內(nèi)容邏輯性差,閱讀體驗差
(3)站點或智能小程序內(nèi)存在大量采集內(nèi)容,自身內(nèi)容生產(chǎn)力極差。
1.1.2 跨領域采集問題:
指站點/智能小程序為了獲取更多流量,發(fā)布不屬于站點/智能小程序領域范圍的內(nèi)容,通常這些內(nèi)容采集自互聯(lián)網(wǎng),內(nèi)容質(zhì)量及相關性低、對搜索用戶價值低。對于這樣的行為搜索會判定該站點/智能小程序的領域專注度不足,會有不同程度的限制展現(xiàn)。
跨領域采集主要包括下面兩類問題:
第一類:主站或主頁的內(nèi)容/標題/關鍵詞/摘要等信息顯示該站有明確的領域或行業(yè),但發(fā)布內(nèi)容與該領域不相關,或相關性較低。
問題示例:美食類智能小程序發(fā)布足球相關內(nèi)容
第二類:站點/智能小程序沒有明確的領域或行業(yè),內(nèi)容涉及多個領域或行業(yè),領域模糊、領域專注度低。
問題示例:智能小程序內(nèi)容涉及多個領域
1.1.3 站群問題:
指批量構造多個站點/智能小程序,獲取搜索流量的行為。站群中的站點/智能小程序大多質(zhì)量低、資源稀缺性低、內(nèi)容相似度高、甚至復用相同模板,難以滿足搜索用戶的需求。
問題示例:多個智能小程序復用同一模板,內(nèi)容質(zhì)量低、相似度高
關于颶風算法的更多信息請參考:
2019.8.22 【官方說法】颶風算法3.0解讀
2019.8.8 颶風算法3.0即將上線,控制跨領域采集及站群問題
2018.9.20 【官方說法】颶風算法2.0解讀
2018.9.13 百度搜索將推出颶風算法2.0,嚴厲打擊惡劣采集行為
2017.7.4 百度推出颶風算法,嚴厲打擊惡劣采集
1.2 勁風算法 ——針對惡劣聚合頁問題
2020年2月,百度搜索技術團隊發(fā)現(xiàn),部分網(wǎng)站及智能小程序通過惡意構造聚合頁面內(nèi)容來獲取搜索排名,獲得搜索用戶關注,上線勁風算法,控制惡意構造聚合頁的問題對搜索用戶的影響。
聚合頁,是指頁面并無文章主體內(nèi)容,而是多個頁面的索引鏈接圍繞在特定主題下的信息整合頁。
惡劣聚合頁問題主要包括以下四種類型:
(1)頁面內(nèi)容與站點本身所屬領域不符,或站點無專注領域,多為采集拼湊內(nèi)容。
問題示例1:站點內(nèi)容領域分散
(2)頁面內(nèi)容與標題及頁面中標記的標簽不符。
問題示例2:頁面內(nèi)容與標題不符
(3)由網(wǎng)站搜索功能生成的靜態(tài)搜索結果頁。
問題示例3:靜態(tài)搜索結果頁
(4)空短、無有效信息、失效的聚合頁。
問題示例4:無有效信息的聚合頁
關于勁風算法的更多信息請參考:
2020.3.5 【官方解讀】勁風算法官方解讀
2020.2.27 勁風算法即將上線
1.3 細雨算法2.0 ——針對B2B領域低質(zhì)問題
2018年6月,百度搜索發(fā)布細雨算法,針對B2B行業(yè)的網(wǎng)站受益問題進行規(guī)范和引導。
2019年11月,百度搜索發(fā)布細雨算法2.0,針對B2B行業(yè)的惡劣違規(guī)問題及低質(zhì)內(nèi)容。
細雨算法主要針對以下問題:
1.3.1 頁面標題作弊及誤導:
(1)非公司官網(wǎng),title中包含“官網(wǎng)”等字樣,誤導搜索用戶認為是官網(wǎng)
問題示例4:
(2)頁面title中堆砌相近關鍵詞;
問題示例5:
(3)頁面title中穿插火星文字或者特殊符號,影響正常閱讀;
問題示例6:
(4) 頁面title中穿插受益方式。
問題示例7:
1.3.2 頁面正文內(nèi)容中存在受益信息:
(1)正文內(nèi)容不完整,頻繁穿插變形的受益方式。
具體是指:正文內(nèi)容為無價值內(nèi)容的拼接或者正文內(nèi)容不完整,同時采用“英文字母”、“漢字諧音”、“特殊符合”、“全角符合”等方式代替聯(lián)系方式,穿插在正文內(nèi)容中。
舉例:5992八⑧⑧⑧
舉例:13800138000
問題示例8:
(2)文章的配圖圖片中存在受益聯(lián)系方式。
具體是指:圖片中聯(lián)系方式水印面積較大,嚴重損害瀏覽體驗。
問題示例9:
(3)正文中商品或者服務信息內(nèi)容為亂采集、拼接而成、排版混亂、用戶從頁面中無法獲得商品或者服務信息。
問題示例10:
1.3.3 惡劣違規(guī)內(nèi)容:
(1)頁面內(nèi)容惡劣采集。
如:拼接內(nèi)容、純采集內(nèi)容、跨領域采集內(nèi)容等。
問題示例:B2B領域小程序采集時事新聞
(2)發(fā)布軟文信息。
問題示例:利用小程序頁面發(fā)布軟文,頁面標題是“垃圾車廠家哪家好“,內(nèi)容是品牌軟文,對用戶產(chǎn)生誤導
(3)發(fā)布無法滿足用戶需求的空白頁面,對用戶完全無價值。
問題示例:該小程序頁面為空白頁面
(4)商品信息有誤。
如:商品詳情、價格等與實際情況不符
問題示例:商品價格與實際情況不符
(5)功能不可用。
如:交易、聯(lián)系電話、查看詳情等交互功能不可用等情況。
1.3.4 低質(zhì)內(nèi)容:
1、圖片內(nèi)容低質(zhì)。
如:圖片內(nèi)容與文字描述不一致、圖片嵌入電話號碼、圖片質(zhì)量極低影響閱讀體驗等。
問題示例:圖片中大量嵌入聯(lián)系電話
2、頁面內(nèi)容低質(zhì)。
如:頁面中只有圖片無有效信息,或信息提供不完善等情況。
問題示例:網(wǎng)站僅有圖片作為展示,沒有文字說明
關于細雨算法2.0的更多信息請參考:
2019.11.15 【官方說法】細雨算法2.0解讀
2019.11.7 針對B2B領域低質(zhì)內(nèi)容,細雨算法即將升級
2018.7.5 【官方說法】B2B領域細雨算法解讀
2018.6.28 百度搜索推出細雨算法 促進供求黃頁類站點生態(tài)健康發(fā)展
1.4 藍天算法 ——針對目錄交易問題
2016年11月,百度搜索推出藍天算法,持續(xù)打擊新聞類站點售賣軟文、目錄的行為,還用戶一片搜索藍天。被“藍天算法”所覆蓋的站點將會被降低其在百度搜索系統(tǒng)中的評價。
問題示例11:
關于藍天算法的更多信息請參考:
2016.11.21 百度推出藍天算法,嚴厲打擊新聞類站點售賣目錄
目錄
1. 頁面內(nèi)容質(zhì)量
2. 用戶需求滿足
3. 用戶體驗友好
4. 搜索公正及用戶安全
來源:百度搜索資源平臺 百度搜索學堂