百度鼓勵(lì)原創(chuàng),您準(zhǔn)備好了嗎
互聯(lián)網(wǎng)鼓勵(lì)原創(chuàng),尤其是對于搜索引擎,更希望將優(yōu)質(zhì)的原創(chuàng)內(nèi)容推薦給用戶,16號(hào)的時(shí)候,百度站長平臺(tái)lee發(fā)表了一篇名為:談?wù)勗瓌?chuàng)項(xiàng)目那點(diǎn)事。其主要目的,就是鼓勵(lì)所有的站長支持原創(chuàng)。那么,百度是如何判斷網(wǎng)站內(nèi)容是原創(chuàng)的呢?Q豬就這篇文章,說一下,自己的看法,歡迎拍磚。
重視原創(chuàng)的目的:
1、采集泛濫
分析:互聯(lián)網(wǎng)上,采集泛濫的地區(qū)主要分布在,新聞、咨詢、小說等領(lǐng)域,由于現(xiàn)在采集器越來越復(fù)雜,一般一個(gè)網(wǎng)站是很難防止不被采集的。
做網(wǎng)站做內(nèi)容,我們經(jīng)常會(huì)發(fā)現(xiàn)的一個(gè)問題,就是,自己在網(wǎng)站上,原創(chuàng)更新了一篇內(nèi)容,但是過幾天去百度查詢排名的時(shí)候,會(huì)發(fā)現(xiàn),由于網(wǎng)站權(quán)重等因素,那些轉(zhuǎn)載了該篇文章的網(wǎng)站,卻排在了前列。
對于大多數(shù)的中小型網(wǎng)站來說,搜索流量在總流量中,占有很重要的位置,如果長期原創(chuàng),卻不能獲得應(yīng)有的排名和流量,站長就會(huì)失去原創(chuàng)的興趣,從而減少原創(chuàng)的比例。
2、提高用戶體驗(yàn)
分析:大家都知道,原創(chuàng)文章對于網(wǎng)站的重要性,但是創(chuàng)造原創(chuàng)內(nèi)容是一件很困難、很費(fèi)時(shí)間的事情,有市場就會(huì)機(jī)會(huì),所以市場了出現(xiàn)了大量的偽原創(chuàng)工具,原理就是將文章章節(jié)打亂,通過重新組合、添加關(guān)鍵詞等方式,努力將原來的文章變成一篇新的。
這些文章有一個(gè)共同點(diǎn)就是,可讀性較差,從而導(dǎo)致用戶體驗(yàn)度不高,另一方面,對搜索引擎的搜索質(zhì)量也會(huì)產(chǎn)生一定的影響。
提高用戶體驗(yàn),這是一個(gè)永遠(yuǎn)的話題,對于搜索引擎來說,雖然現(xiàn)在很多方面都做的還不夠盡如人意,但是至少一直是在朝這個(gè)方向努力。Q豬建議,對于站長來說,只有增加網(wǎng)站原創(chuàng)內(nèi)容,提高用戶體驗(yàn),網(wǎng)站才能長久的發(fā)展下去。
3、鼓勵(lì)原創(chuàng)作者和原創(chuàng)內(nèi)容
分析:就像第一點(diǎn)說的那樣,只有對堅(jiān)持原創(chuàng)的網(wǎng)站、原創(chuàng)的內(nèi)容,給予適當(dāng)?shù)臋?quán)重、排名,只有原創(chuàng)作者享受到了,原創(chuàng)所帶來的巨大利益,作者才會(huì)堅(jiān)持原創(chuàng)下去。
判斷原創(chuàng)內(nèi)容有哪些困難:
1、冒充原創(chuàng),篡改關(guān)鍵信息
分析:其實(shí)很多堅(jiān)持原創(chuàng)的網(wǎng)站,都是那些中小型網(wǎng)站,但是由于蜘蛛爬行頻率、搜索引擎重視程度等原因,在原創(chuàng)文章發(fā)表以后,經(jīng)過其他網(wǎng)站的轉(zhuǎn)載,篡改文章中涉及到的版權(quán)、關(guān)鍵詞等信息,冒充原創(chuàng)。
由于轉(zhuǎn)載網(wǎng)站在權(quán)重等方面的優(yōu)勢,搜索引擎蜘蛛很難去判斷,這篇文章是哪一個(gè)網(wǎng)站抄襲了哪一個(gè)網(wǎng)站。
2、使用偽原創(chuàng)工具,對文章改頭換面,批量生產(chǎn)“原創(chuàng)文章”。
分析:不管如何判斷文章是否為原創(chuàng),由于網(wǎng)絡(luò)上數(shù)以億計(jì)的海量文章,判斷的主體,都是程序來檢驗(yàn)的。是程序就會(huì)有漏洞,是程序就可以摸索其中的規(guī)律,很多偽原創(chuàng)工具,可以通過這些工具和漏洞,將文章重新組合以后,變成“原創(chuàng)”。
由于制造原創(chuàng)的工具也是隨著算法的變化而變化的,在判斷過程中,也會(huì)擁有一定的難度。
從百度的描述中,可以看到,由于通過工具生產(chǎn)的所謂“原創(chuàng)文章”,具有語句不通順,用戶可讀性差等原因,這些內(nèi)容,是這段時(shí)間,百度重點(diǎn)整治的對象。Q豬提醒,如果你也在使用這些工具,就趕緊停止吧。
3、結(jié)構(gòu)差異化
分析:我們知道,每個(gè)網(wǎng)站的結(jié)構(gòu)都具有差異化,搜索引擎在抓取內(nèi)容時(shí),一般是通過分析,同一個(gè)網(wǎng)站中,哪些內(nèi)容是通用的、哪些內(nèi)容是真正具有價(jià)值的,然后分析這些有價(jià)值的內(nèi)容,再索引至數(shù)據(jù)庫中。
但是,不同的站點(diǎn)結(jié)構(gòu)化差異比較大,html標(biāo)簽的含義和分布也不同,因此提取關(guān)鍵信息如標(biāo)題、作者和時(shí)間的難易程度差別也比較大。所以,每個(gè)網(wǎng)站都需要一個(gè)合理的網(wǎng)站結(jié)構(gòu),簡單、清晰、明確,不僅讓搜索引擎可以很清楚的抓取網(wǎng)站內(nèi)容,也可以讓用戶更流暢的瀏覽網(wǎng)站內(nèi)容。
關(guān)于如何建立一個(gè)合理的網(wǎng)站結(jié)構(gòu),可以看一下,Q豬的另一篇文章:如何制作合理的網(wǎng)站結(jié)構(gòu)
百度為鼓勵(lì)原創(chuàng),所采取的措施:
1、單獨(dú)成立原創(chuàng)項(xiàng)目組
分析:按照百度的說法,這個(gè)部門將長期成立,為如何判斷原創(chuàng),提供技術(shù)、產(chǎn)品、運(yùn)營、法務(wù)等各方面支持。
2、 原創(chuàng)識(shí)別“起源”算法
百度如何判斷原創(chuàng)內(nèi)容,這個(gè)才是重點(diǎn)。
a.首先通過內(nèi)容的相似程度,將網(wǎng)絡(luò)上,所有主題相似、內(nèi)容相近的文章,不管原創(chuàng)或者采集,都聚合在一起。
b.然后通過作者、發(fā)布時(shí)間、鏈接指向、用戶評論、作者和站點(diǎn)的歷史原創(chuàng)情況、轉(zhuǎn)發(fā)軌跡等因素,綜合考慮,判斷原創(chuàng)內(nèi)容。
c.最后通過價(jià)值分析系統(tǒng),判斷該原創(chuàng)內(nèi)容的價(jià)值高低,進(jìn)而適當(dāng)?shù)闹笇?dǎo)最終排名順序。
3、原創(chuàng)星火計(jì)劃
分析:這個(gè)計(jì)劃需要百度和站長共同努力來維護(hù)互聯(lián)網(wǎng)的生態(tài)環(huán)境,站長推薦原創(chuàng)內(nèi)容,搜索引擎通過一定的判斷后優(yōu)待原創(chuàng)內(nèi)容,共同推進(jìn)生態(tài)的改善,鼓勵(lì)原創(chuàng),這就是“原創(chuàng)星火計(jì)劃”,旨在快速解決當(dāng)前面臨的嚴(yán)重問題。
簡單來說,就是站長推薦原創(chuàng)內(nèi)容,然后百度再通過算法、甚至人工來判斷是否為原創(chuàng),這是一個(gè)改進(jìn)算法的過程,也是一個(gè)較快實(shí)現(xiàn)原創(chuàng)內(nèi)容被發(fā)掘的過程。
綜合上面的觀點(diǎn),要獲得百度鼓勵(lì)原創(chuàng)政策的照顧,作為站長首先需要做到的就是,網(wǎng)站內(nèi)部做好結(jié)構(gòu)優(yōu)化、堅(jiān)持原創(chuàng)制作、鼓勵(lì)用戶評論、保證網(wǎng)站內(nèi)部鏈接的暢通,如果可以,保留每篇文章發(fā)布的時(shí)間。
當(dāng)然還有最重要的一定,就是如果文字是轉(zhuǎn)載的,請保留原創(chuàng)的鏈接指向,這將有助于本身網(wǎng)站的原創(chuàng)判斷。
來源:投稿
來源:月光博客