李彥宏超鏈分析專利,超鏈分析算法的作用
互聯(lián)網(wǎng)上的信息非常的龐大,要想讓用戶搜索到精準(zhǔn)信息是很難的。搜索引擎技術(shù)非常復(fù)雜。百度創(chuàng)始人李彥宏在創(chuàng)立百度之前就已經(jīng)是國際上比較厲害的搜索引擎技術(shù)專家了。據(jù)說李彥宏在找風(fēng)險投資時,投資人詢問了三個搜索引擎界的技術(shù)牛人一個同樣的問題:要了解搜索引擎技術(shù)應(yīng)該找誰,其中兩個人回答說找李彥宏,由此投資人就斷定李彥宏是最了解搜索引擎的人之一。
李彥宏超鏈分析示意圖
這其實(shí)就是現(xiàn)實(shí)生活中鏈接關(guān)系的應(yīng)用:要判斷哪個人或網(wǎng)頁最具權(quán)威性,不能光看這個人或網(wǎng)頁,自己怎么說,還要看其他人對這個網(wǎng)頁怎么評價。超鏈分析的基本原理是在某次搜索的所有結(jié)果中,被其他網(wǎng)頁用超鏈指向得越多的網(wǎng)頁,其價值就越高,就越應(yīng)該在結(jié)果排序中排名越靠前。
超鏈分析是一種引用投票機(jī)制,對于靜態(tài)網(wǎng)頁或者網(wǎng)站主頁,它具有一定的合量性,因?yàn)檫@樣的網(wǎng)頁容易根據(jù)其在互聯(lián)網(wǎng)上受到的評價產(chǎn)生不同的超鏈指向量,超鏈分析的結(jié)果可以反映網(wǎng)頁的重要程度,從而給用戶提供出更重要、更有價值的搜索結(jié)果。
李彥宏1997年就提交了一份名為“超鏈文件檢索系統(tǒng)和方法”的專利申請,這比Google創(chuàng)始人發(fā)明PR要早得多,不得不說這是非常具有前瞻性的研究工作。在這份專利中,李彥宏提出了與傳統(tǒng)信息檢索系統(tǒng)不同的基于鏈接的排名方法。
這個系統(tǒng)除了索引頁面之外,還建立一個鏈接詞庫,記錄鏈接錨文字的一些相關(guān)信息,如錨文字中包含哪些關(guān)鍵詞,發(fā)出鏈接的頁面索引,包含特定錨文字的鏈接總數(shù),包含特定關(guān)鍵詞的鏈接都指向哪些頁面。詞庫不僅包含關(guān)鍵詞原型,也包含同一個詞千的其他衍生關(guān)鍵詞。
根據(jù)這些鏈接數(shù)據(jù),尤其是錨文字,計算出基于鏈接的文件相關(guān)性。在用戶搜索時,將得到的基于鏈接的相關(guān)性與基于關(guān)鍵詞匹配的傳統(tǒng)相關(guān)性綜合使用,得到更準(zhǔn)確的排名。
超鏈分析就是通過分析鏈接網(wǎng)站的多少來評價被鏈接的網(wǎng)站質(zhì)量,這保證了用戶在百度搜索時,越受用戶歡迎的內(nèi)容排名越靠前。在今天看來這種基于鏈接的相關(guān)性計算是搜索引擎的常態(tài),每個SEO人員都知道。但是在十七八年前,這無疑是非常創(chuàng)新的概念。百度CEO李彥宏就是超鏈分析專利的唯一持有人,目前該技術(shù)已為世界各大搜索引擎普遍采用。當(dāng)然現(xiàn)在的搜索引擎算法對鏈接的考慮,已經(jīng)不僅僅是錨文字,實(shí)際上要復(fù)雜得多。但是大量精準(zhǔn)有效的外鏈?zhǔn)翘岣吣繕?biāo)關(guān)鍵詞排名的重要因素。在優(yōu)化網(wǎng)站關(guān)鍵詞排名的時候高權(quán)重的外部鏈接還是非常重要的。