日本少妇高潮久久久久久_东京热一区二区三区无码视频_国内精品人妻久久毛片app_男人撕开奶罩揉吮奶头视频_少妇交换做爰做到高潮_睡错了人妻公h_国产男女猛烈无遮挡a片漫画_男女啪啪做爰高潮全过有多钱_国产猛男猛女超爽免费视频

Categories


Tags


金字塔算法模型初識

Web3.0的到來后基于互聯(lián)網(wǎng)營銷模式層出不窮,seo就是其中一塊炙手可熱的領(lǐng)域。本人對百度算法跟蹤研究已近5年的時間,我主要從事的是算法逆向,也就是通過一些相關(guān)指標來判斷百度排名規(guī)則。

在敘述百度算法之前我先講一下我在前不久之前看到百度搜索研發(fā)部博客中的一篇文章《淺談網(wǎng)頁搜索排序中的投票模型》里面敘述了美國的選舉制度,這其實就是百度的其中一種投票體系的原型,我是這么認為的。用一張簡單的圖來闡述一下整個過程:

金字塔算法模型初識

看了上圖我相信大家都應(yīng)該明白,排序的殘產(chǎn)生應(yīng)該是在“總數(shù)據(jù)庫”和百度服務(wù)器之間發(fā)生的變化,百度蜘蛛會采集很多內(nèi)容回來,全部存放入總服務(wù)器,總服務(wù)器通過規(guī)則判斷篩選后最終在web服務(wù)器上放出頁面給出排序,其實就是在“總數(shù)據(jù)庫”發(fā)生了一些列的算法變化。當然我這邊闡述的內(nèi)容中的各個服務(wù)器和名稱全部是我個人定義,但基本的邏輯應(yīng)該是如此的,按照數(shù)據(jù)分析的原則:數(shù)據(jù)收集——數(shù)據(jù)處理——數(shù)據(jù)分析儀——數(shù)據(jù)展現(xiàn),其實就很能概括百度這一行為。

雖然百度一方面做著推廣競價,一方面又希望給廣大用戶一個良好的檢索體驗,可能很多seoer又恨又愛,但是根據(jù)官方的各種文本我們還是姑且相信百度搜索研發(fā)部門還是希望給用戶一個好的檢索體驗。

說到了這里我不得不用一張圖來給大家展示一下,什么是金字塔模型:

金字塔算法模型初識

看了這圖后,可能有限人應(yīng)該會有質(zhì)疑,這很像漏斗原理,對!沒錯,就跟漏斗原理很像,但是沒用金字塔來的勵志,大家都希望能夠獲得金字塔最高峰。

排序篩選過程又是如何的呢?我們引用一下百度搜索研發(fā)部文章內(nèi)的一段內(nèi)容:

“系統(tǒng)里有n個網(wǎng)頁,有m個特征(頁面質(zhì)量、頁面內(nèi)容豐富度、頁面超鏈、文本相關(guān)性等)對n個網(wǎng)頁有不同的打分,如何根據(jù)這些特征的”投票“,選出最適合放在第一位的網(wǎng)頁呢?

從選舉的例子中,我們可以得到的幾個啟示:

1. 設(shè)計算法時,要避免出現(xiàn)“贏者通吃”帶來的信息丟失問題。

2. 不要因為某幾個特征特別好,就把某個網(wǎng)頁排到最前,或者因為某幾個特征特別差,就把某個網(wǎng)頁拋棄。

3. 最合適放在首位的網(wǎng)頁不一定是在每個特征上都最好,而應(yīng)該是能夠兼顧所有特征,綜合表現(xiàn)最好的那個。

4. 搜索引擎使用者對搜索結(jié)果的點擊行為,可以看成是對搜索結(jié)果進行的“投票”,這樣的“投票”信息的使用方式,也要注意考慮是否會帶來選舉過程中出現(xiàn)的種種不合理。

以上提到的種種選舉方案,僅僅是對“多候選人單職位的”的情況進行討論,而搜索引擎面對的問題,則更類似于“多候選人排序”的情況,也即:

系統(tǒng)里有n個網(wǎng)頁,有m個特征(頁面質(zhì)量、頁面內(nèi)容豐富度、頁面超鏈、文本相關(guān)性等)對n個網(wǎng)頁有不同的打分,如何根據(jù)這些特征的“投票”,決定n個網(wǎng)頁的順序?

而這個“多候選人排序”問題,是有一個“不可能的民主”的理論的,該理論的大意是,“合理”的民主應(yīng)該滿足3個條件:

1. 如果選民都認為A比B好,那么最終結(jié)果應(yīng)該也是A比B好

2. 沒有“獨裁者”,也即,不存在這樣一個人,無論別人怎么排序,最終結(jié)果的排序都和這個人的排序一致

3. 無關(guān)因素獨立性,也即,在第一次投票完成后,A排在B前面,現(xiàn)在進行第二次投票,如果所有人都沒有改變自己投票中A和B的相對順序,那最終結(jié)果應(yīng)該也是A在B前面

而通過數(shù)學的證明,可以得出結(jié)論:如果某種選舉方式滿足條件1和3,則必然不滿足2,也即必然存在“獨裁者”。

根據(jù)“不可能的民主”理論,和搜索引擎結(jié)合起來看,似乎搜索引擎很難給出一個合理的網(wǎng)頁排序,但是搜索引擎和投票又似乎有所不同,有兩個角度可以破解

1. 認為條件3過于強,需要弱化。

2. 也許在網(wǎng)頁排序問題上,真的存在這樣一個“獨裁特征”,這個“獨裁特征”從目前看來,最適合的應(yīng)該就是“用戶滿意度”了,按照用戶的滿意程度來排序網(wǎng)頁,就是最合理的網(wǎng)頁排序。如何衡量“用戶滿意度”呢?這就是我們一直在努力的。“

相信大家閱讀了這段內(nèi)容后應(yīng)該深有體會,百度算法和選舉制有很大的雷同之處。那么我們做為逆向研究的方向是先從數(shù)據(jù)展現(xiàn)本身研究得出數(shù)據(jù)分析原則,這個是一項長期計劃,因為我們必須對數(shù)以億計的網(wǎng)站進行分析后才可以得出結(jié)論,而事實證明百度排序規(guī)則中不僅僅只有一條算法規(guī)則,會有多重規(guī)則。

前期我也已經(jīng)開發(fā)出一個基于關(guān)鍵詞的簡單分析程序:

這個工具主要是輔助作用,之前討論的選舉制度主要針對的外鏈的有效性,而此工具的主要內(nèi)容是針對相關(guān)性,也就是搜索結(jié)果最后的排序規(guī)則中的先后排序規(guī)則。當然這個工具還是處于毛胚狀態(tài),很多指標都還是沒有加進去,后期大家可以一起參與這份研究,把一些相對比較重要的指標加進去便于我們的研究更加的完善。

如果你是純粹做一個seoer我覺得到這里,你也可以停止閱讀這份研究,因為事實證明,你只要獲得最后排序的相關(guān)算法即可完成工作,通過此工具你已經(jīng)能夠輕松的獲得什么樣的密度情況下可以優(yōu)先獲得排名。倘若你在做價值數(shù)萬的關(guān)鍵詞,我覺得你可以繼續(xù)往下看,因為這里就會講到選舉制度中的外鏈。

選舉制度中的外鏈其實應(yīng)該是放在最前面的,因為這是相對比較民主的一次選舉,不像上述的內(nèi)容相關(guān)性一樣,內(nèi)容相關(guān)性的選舉應(yīng)該是屬于百度內(nèi)部選舉制度,是屬于第二次選舉,而外鏈選舉是屬于第一次選舉,網(wǎng)站通過外鏈來證明自己的同時,證明自己被認可。

說到這里我想到站長很頭疼的一個問題,也就是什么樣的外鏈才算是真實有效的?很多seo工作者或多或少應(yīng)該已經(jīng)建了不少外鏈,但是實際效果不得而知。

但是你通過選舉制度,你可以排除以下幾類人選:

1.剝奪政治權(quán)益的。進百度黑名單的。

2.政治地位低下的。此站本身質(zhì)量低下的。

3.無選舉權(quán)的。也就是不在收錄范圍內(nèi)的。

4.與選舉無關(guān)的。什么叫與選舉無關(guān)?這里其實包含了這么幾個意思,一是說此站內(nèi)容相關(guān)性不高,二是說此站不是真心選舉你的,甚至是不認識你。這也是百度近期的回復中多次提及的內(nèi)容“真心推薦”。

如果你已經(jīng)理解了選舉制度,相信到這里你會變的相對比較明朗,但是你要非常的清楚去認識一件事情也就是什么樣的選舉?選舉制度可以一次性全員投票,也可以級級選舉。

所以說對于外鏈的建設(shè),本身也是一個選舉與被選舉的規(guī)則,百度官方很有可能近期也會放出外鏈查詢工具,告訴你什么外鏈有用什么外鏈沒用,我也會在下一期的時候給出相應(yīng)的工具或者是判斷方案。

來源:左傾觀測站投稿,原文鏈接。

來源:月光博客


Public @ 2020-06-20 16:17:26

網(wǎng)站文章被采集怎么辦?如何減少被采集產(chǎn)生的影響?

網(wǎng)站文章被采集是一個常見的問題,這可能會使您的網(wǎng)站內(nèi)容在其他網(wǎng)站上被重復發(fā)布,從而影響您的網(wǎng)站排名和流量。以下是幾種方法,可幫助您減少被采集帶來的影響: 1. 使用反盜版工具:您可以使用一些反盜版工具,如DMCA或Copyscape,來監(jiān)控您的網(wǎng)站內(nèi)容是否被復制和發(fā)布到其他網(wǎng)站上。 2. 加密網(wǎng)站內(nèi)容:您可以將您的網(wǎng)站內(nèi)容進行加密,使不允許其他網(wǎng)站復制和發(fā)布您的內(nèi)容。 3. 限制訪問權(quán)限:您

Public @ 2023-04-16 16:00:26

如何使用搜外6系統(tǒng)讓文章收錄變得更簡單?

網(wǎng)站的收錄有很多方面的影響,比如網(wǎng)站權(quán)重、網(wǎng)站新舊、網(wǎng)站原創(chuàng)性、網(wǎng)站相關(guān)性、網(wǎng)站更新頻率、網(wǎng)站外鏈導向等,網(wǎng)站為了促進收錄肯定要把各方面都優(yōu)化好,然后針對各個搜索引擎進行一些特殊優(yōu)化。在國內(nèi),絕大部分站長都使用百度搜索引擎,為了促進百度收錄,最好在每天寫完文章以后在百度站長平臺進行鏈接提交。百度站長平臺鏈接提交工具是什么鏈接提交工具是網(wǎng)站主動向百度搜索推送數(shù)據(jù)的工具。本工具加快爬蟲抓取速度,縮短爬

Public @ 2021-06-13 15:55:26

用戶訪問數(shù)據(jù)是否影響搜索排名?

作為AI虛擬助手,我可以告訴您,谷歌等搜索引擎已經(jīng)明確表示,用戶訪問數(shù)據(jù)不是搜索排名的直接因素。搜索引擎使用復雜的算法來確定搜索結(jié)果的排名,其中包括頁面內(nèi)容、鏈接質(zhì)量、關(guān)鍵詞等。盡管用戶訪問量可能是頁面質(zhì)量的一個指標,但沒有足夠的證據(jù)表明它直接影響搜索排名。

Public @ 2023-04-09 03:00:32

防止博客文章被惡意轉(zhuǎn)載的方法

所謂“惡意轉(zhuǎn)載”,指的是一些不合常規(guī)和不文明的轉(zhuǎn)載行為。包括批量的轉(zhuǎn)載很多文章,通過程序自動轉(zhuǎn)載,轉(zhuǎn)載后刪除署名或者原文的鏈接等等,很多博客都遇到過這種情況,大量的不注明出處的轉(zhuǎn)載,會使得原創(chuàng)作者處于非常尷尬的處境,辛苦創(chuàng)作的文章得不到應(yīng)有的回報。下面我就介紹一些針對這類惡意轉(zhuǎn)載的應(yīng)對措施。通過技術(shù)方式提醒增加這樣一段JavaScript代碼,當別人復制你文章內(nèi)容的時候,系統(tǒng)會自動將版權(quán)信息和原文

Public @ 2018-02-25 16:17:28

更多您感興趣的搜索

0.510932s