HITS算法
HITS算法(Hypertext-Induced Topic Selection),也稱為Hubs and Authorities algorithm,是一種用來計算圖中節(jié)點相對重要性的算法。它是Larry Page and Sergey Brin 在1998年首次提出,以提高他們搜索引擎Google的網(wǎng)頁檢索準(zhǔn)確性。HITS算法通過分析不同節(jié)點間的連接關(guān)系來鑒定節(jié)點的重要性分?jǐn)?shù):一個節(jié)點被稱為網(wǎng)頁中一個著名的Authority(權(quán)威性節(jié)點),另一個節(jié)點被稱為Hub(節(jié)點中心性)。 算法的步驟如下: 1. 初始化每個節(jié)點的Authority score和Hub score為1。 2. 計算每個節(jié)點都有誰鏈接它,這些鏈接它的節(jié)點就是它的**Incoming Linker**;計算它指向哪些節(jié)點,這些節(jié)點稱為它的**Outgoing Linker**。 3. 計算每個節(jié)點的新Authority score:節(jié)點的新Authority score等于它收到的來自上一次迭代計算的Incoming Linker的Hub score之和。 4. 計算每個節(jié)點的新Hub score:節(jié)點的新Hub Score等于它收到的來自上一次迭代計算的Outgoing Linker的Authority score之和。 5. 重復(fù)執(zhí)行上述步驟,直至Authority score和Hub score不再改變?yōu)橹埂? 最終每個節(jié)點的Authority score和Hub score就是它的重要性分值。節(jié)點的Authority score可以反映它在整個網(wǎng)站中的權(quán)威性,Hub score來反映它在整個網(wǎng)站中的中心性。