日本少妇高潮久久久久久_东京热一区二区三区无码视频_国内精品人妻久久毛片app_男人撕开奶罩揉吮奶头视频_少妇交换做爰做到高潮_睡错了人妻公h_国产男女猛烈无遮挡a片漫画_男女啪啪做爰高潮全过有多钱_国产猛男猛女超爽免费视频

Categories


Tags


怎樣減少無(wú)效URL的爬行和索引 – 無(wú)完美解

少年老成的云晨守望同學(xué)(題外話:少年老成是好事哈。我20多歲時(shí)人家說(shuō)我像40歲,我40多歲時(shí)好多人說(shuō)我像30多,男人20到50歲可以做到基本一個(gè)樣子)在網(wǎng)絡(luò)營(yíng)銷(xiāo)實(shí)戰(zhàn)密碼網(wǎng)站貼了個(gè)帖子:透過(guò)京東商城看國(guó)內(nèi)一線B2C網(wǎng)站SEO通病。建議先看那個(gè)帖子再回來(lái)看本帖,不然不容易明白下面在說(shuō)什么。

簡(jiǎn)單說(shuō),帖子指出一個(gè)嚴(yán)重而且現(xiàn)實(shí)的SEO問(wèn)題:很多網(wǎng)站,尤其是B2C,產(chǎn)品條件過(guò)濾系統(tǒng)(如選擇產(chǎn)品的品牌、價(jià)格、尺寸、性能、參數(shù)等)會(huì)產(chǎn)生大量無(wú)效URL,之所以稱(chēng)為無(wú)效只是從SEO角度看的,這些URL并不能產(chǎn)生SEO作用,反倒有負(fù)面作用,所以這些URL不收錄為好,原因包括:

大量過(guò)濾條件頁(yè)面內(nèi)容重復(fù)或極為類(lèi)似(大量復(fù)制內(nèi)容將使網(wǎng)站整體質(zhì)量下降)

大量過(guò)濾條件頁(yè)面沒(méi)有對(duì)應(yīng)產(chǎn)品,頁(yè)面無(wú)內(nèi)容(如選擇“100元以下42寸LED電視”之類(lèi)的)

絕大部分過(guò)濾條件頁(yè)面沒(méi)有排名能力(排名能力比分類(lèi)頁(yè)面低得多)卻浪費(fèi)一定權(quán)重

這些過(guò)濾條件頁(yè)面也不是產(chǎn)品頁(yè)面收錄的必要通道(產(chǎn)品頁(yè)面應(yīng)該有其它內(nèi)鏈幫助爬行和收錄)

爬行大量過(guò)濾條件頁(yè)面極大浪費(fèi)蜘蛛爬行時(shí)間,造成有用頁(yè)面收錄機(jī)會(huì)下降(過(guò)濾條件頁(yè)面組合起來(lái)是巨量的)

那么怎樣盡量使這些URL不被爬行和索引、收錄呢?前幾天的一篇帖子如何隱藏內(nèi)容也可能成為SEO問(wèn)題討論的是類(lèi)似問(wèn)題,這種過(guò)濾頁(yè)面就是想隱藏的內(nèi)容種類(lèi)之一。不過(guò)可惜,我目前想不出完美的解決方法。云晨守望提出兩個(gè)方法,我覺(jué)得都無(wú)法完美解決。

一是將不想收錄的URL保持為動(dòng)態(tài)URL,甚至故意越動(dòng)態(tài)越好,以阻止被爬行和收錄。但是,搜索引擎現(xiàn)在都能爬行、收錄動(dòng)態(tài)URL,而且技術(shù)上越來(lái)越不是問(wèn)題。雖然參數(shù)多到一定程度確實(shí)不利于收錄,但4、5個(gè)參數(shù)通常還可以收錄。我們無(wú)法確認(rèn)需要多少參數(shù)才能阻止收錄,所以不能當(dāng)作一個(gè)可靠的方法。而且這些URL接收內(nèi)鏈,又沒(méi)有什么排名能力,還是會(huì)浪費(fèi)一定權(quán)重。

第二個(gè)方法,robots禁止收錄。同樣,URL接收了內(nèi)鏈也就接收了權(quán)重,robots文件禁止爬行這些URL,所以接收的權(quán)重不能傳遞出去(搜索引擎不爬行就不知道有什么導(dǎo)出鏈接),頁(yè)面成為權(quán)重只進(jìn)不出的黑洞。

連向這些URL的鏈接配合nofollow也不完美,和robots禁止類(lèi)似,nofollow在Google的效果是這些URL沒(méi)有接收權(quán)重,權(quán)重卻也沒(méi)有被分配到其它鏈接上,所以權(quán)重同樣浪費(fèi)了。百度據(jù)稱(chēng)支持nofollow,但權(quán)重怎么處理未知。

將這些URL鏈接放在Flash、JS里也沒(méi)有用,搜索引擎已經(jīng)可以爬行Flash、JS里的鏈接,而且估計(jì)以后越來(lái)越擅長(zhǎng)爬。很多SEO忽略了的一點(diǎn)是,JS中的鏈接不僅能被爬,也能傳遞權(quán)重,和正常連接一樣。

也可以將過(guò)濾條件鏈接做成AJAX形式,用戶點(diǎn)擊后不會(huì)訪問(wèn)一個(gè)新的URL,還是在原來(lái)URL上,URL后面加了#,不會(huì)被當(dāng)成不同URL。和JS問(wèn)題一樣,搜索引擎正在積極嘗試爬行、抓取AJAX里的內(nèi)容,這個(gè)方法也不保險(xiǎn)。

還一個(gè)方法是在頁(yè)面head部分加noindex+follow標(biāo)簽,意即本頁(yè)面不要索引,但跟蹤頁(yè)面上的鏈接。這樣可以解決復(fù)制內(nèi)容問(wèn)題,也解決了權(quán)重黑洞問(wèn)題(權(quán)重是可以隨著導(dǎo)出鏈接傳到其它頁(yè)面的),不能解決的是浪費(fèi)蜘蛛爬行時(shí)間問(wèn)題,這些頁(yè)面還是要被蜘蛛爬行抓取的(然后才能看到頁(yè)面html里的noindex+follow標(biāo)簽),對(duì)某些網(wǎng)站來(lái)說(shuō),過(guò)濾頁(yè)面數(shù)量巨大,爬行了這些頁(yè)面,蜘蛛就沒(méi)足夠時(shí)間爬有用頁(yè)面了。

再一個(gè)可以考慮的方法是隱藏頁(yè)面(cloaking),也就是用程序檢測(cè)訪問(wèn)者,是搜索引擎蜘蛛的話返回的頁(yè)面拿掉這些過(guò)濾條件鏈接,是用戶的話才返回正常的有過(guò)濾條件的頁(yè)面。這是一個(gè)比較理想的解決方法,唯一的問(wèn)題是,可能被當(dāng)作作弊。搜索引擎常跟SEO講的判斷是否作弊的最高原則是:如果沒(méi)有搜索引擎,你會(huì)不會(huì)這么做?或者說(shuō),某種方法是否只是為了搜索引擎而采用?顯然,用cloaking隱藏不想被爬行的URL是為搜索引擎做的,不是為用戶做的。雖然這種情況下的cloaking目的是美好的,沒(méi)有惡意的,但風(fēng)險(xiǎn)是存在的,膽大的可試用。

還一個(gè)方法是使用canonical標(biāo)簽,最大問(wèn)題是百度是否支持未知,而且canonical標(biāo)簽是對(duì)搜索引擎的建議,不是指令,也就是說(shuō)這個(gè)標(biāo)簽搜索引擎可能不遵守,等于沒(méi)用。另外,canonical標(biāo)簽的本意是指定規(guī)范化網(wǎng)址,過(guò)濾條件頁(yè)面是否適用有些存疑,畢竟,這些頁(yè)面上的內(nèi)容經(jīng)常是不同的。

目前比較好的方法之一是iframe+robots禁止。將過(guò)濾部分代碼放進(jìn)iframe,等于調(diào)用其它文件內(nèi)容,對(duì)搜索引擎來(lái)說(shuō),這部分內(nèi)容不屬于當(dāng)前頁(yè)面,也即隱藏了內(nèi)容。但不屬于當(dāng)前頁(yè)面不等于不存在,搜索引擎是可以發(fā)現(xiàn)iframe中的內(nèi)容和鏈接的,還是可能爬行這些URL,所以加robots禁止爬行。iframe中的內(nèi)容還是會(huì)有一些權(quán)重流失,但因?yàn)閕frame里的鏈接不是從當(dāng)前頁(yè)面分流權(quán)重,而只是從調(diào)用的那個(gè)文件分流,所以權(quán)重流失是比較少的。除了排版、瀏覽器兼容性之類(lèi)的頭疼問(wèn)題,iframe方法的一個(gè)潛在問(wèn)題是被認(rèn)為作弊的風(fēng)險(xiǎn)。現(xiàn)在搜索引擎一般不認(rèn)為iframe是作弊,很多廣告就是放在iframe中,但隱藏一堆鏈接和隱藏廣告有些微妙的區(qū)別?;氐剿阉饕媾袛嘧鞅椎目傇瓌t上,很難說(shuō)這不是專(zhuān)門(mén)為搜索引擎做的。記得Matt Cutts說(shuō)過(guò),Google以后可能改變處理iframe的方式,他們還是希望在同一個(gè)頁(yè)面上看到普通用戶能看到的所有內(nèi)容。

總之,對(duì)這個(gè)現(xiàn)實(shí)、嚴(yán)重的問(wèn)題,我目前沒(méi)有自己覺(jué)得完美的答案。當(dāng)然,不能完美解決不是就不能活了,不同網(wǎng)站SEO重點(diǎn)不同,具體問(wèn)題具體分析,采用上述方法中的一種或幾種應(yīng)該可以解決主要問(wèn)題。

而最最最大的問(wèn)題還不是上述這些,而是有時(shí)候你想讓這些過(guò)濾頁(yè)面被爬行和收錄,這才是杯具的開(kāi)始。以后再討論。

來(lái)源:SEO每天一貼 Zac 昝輝


Public @ 2009-09-07 16:21:51

搜索引擎收錄網(wǎng)頁(yè)的四個(gè)階段

作為SEO從業(yè)者,不僅要被搜索引擎抓取,還要被收錄,最重要的是在收錄后有良好的排名,本文將簡(jiǎn)單分析下搜索引擎收錄網(wǎng)頁(yè)的四個(gè)階段。每個(gè)網(wǎng)站、每個(gè)網(wǎng)頁(yè)的排名都是不一樣的,看看你的網(wǎng)站處于哪個(gè)階段呢?搜索引擎收錄網(wǎng)頁(yè)的四個(gè)階段 PageRank 搜索引擎 建站教程 第1張網(wǎng)頁(yè)收錄第一階段:大小通吃搜索引擎的網(wǎng)頁(yè)抓取都是采取「大小通吃」的策略,也就是把網(wǎng)頁(yè)中能發(fā)現(xiàn)的鏈接逐一加入到待抓取URL中,機(jī)械性的將

Public @ 2012-08-25 16:22:23

搜索引擎中各關(guān)鍵功能模塊功能簡(jiǎn)介

(1)爬蟲(chóng):從互聯(lián)網(wǎng)爬取原始網(wǎng)頁(yè)數(shù)據(jù),存儲(chǔ)于文檔知識(shí)庫(kù)服務(wù)器。(2)文檔知識(shí)庫(kù)服務(wù)器:存儲(chǔ)原始網(wǎng)頁(yè)數(shù)據(jù),通常是分布式Key-Value數(shù)據(jù)庫(kù),能根據(jù)URL/UID快速獲取網(wǎng)頁(yè)內(nèi)容。(3)索引:讀取原始網(wǎng)頁(yè)數(shù)據(jù),解析網(wǎng)頁(yè),抽取有效字段,生成索引數(shù)據(jù)。索引數(shù)據(jù)的生成方式通常是增量的,分塊/分片的,并會(huì)進(jìn)行索引合并、優(yōu)化和刪除。生成的索引數(shù)據(jù)通常包括:字典數(shù)據(jù)、倒排表、正排表、文檔屬性等。生成的索引存儲(chǔ)

Public @ 2017-08-24 16:22:25

SEO大咖夜息對(duì)于新站優(yōu)化的一些建議

SEO作為搜索引擎優(yōu)化,使得很多人認(rèn)為這一個(gè)『優(yōu)化』工作對(duì)初創(chuàng)網(wǎng)站來(lái)說(shuō)并非優(yōu)先級(jí)很高的事項(xiàng)。但往往到了網(wǎng)站成型之后,發(fā)現(xiàn)SEO工作已經(jīng)無(wú)處下手。本文就談?wù)勀男┕ぷ魇且粋€(gè)新站點(diǎn)在產(chǎn)品上線之初、甚至上線之前就必須要引起重視。今天我們請(qǐng)到了SEO界大牛、ITSEO創(chuàng)始人夜息跟大家分享一下新站點(diǎn)常見(jiàn)的seo問(wèn)題。1. 網(wǎng)站URL穩(wěn)定對(duì)于初創(chuàng)網(wǎng)站來(lái)說(shuō),有很多網(wǎng)頁(yè)會(huì)在站點(diǎn)發(fā)展過(guò)程中面臨改版甚至重構(gòu)。而搜索引擎

Public @ 2016-04-18 16:17:34

一個(gè)SEO優(yōu)化良好的網(wǎng)站有哪些特征?

一個(gè)網(wǎng)站在搜索引擎中表現(xiàn)良好,一般至少會(huì)在SEO中的某個(gè)方面做得很好,從整體方面來(lái)講,SEO良好的網(wǎng)站主要有如下的一些特征:1、網(wǎng)站結(jié)構(gòu)清晰合理,代碼量與文字比例較小,蜘蛛訪問(wèn)網(wǎng)站沒(méi)有太多的阻礙。這是一個(gè)最基本的特點(diǎn),在網(wǎng)站開(kāi)始搭建的時(shí)候,網(wǎng)站的結(jié)構(gòu)設(shè)計(jì)會(huì)是一個(gè)工作重點(diǎn)(比如我們最常用的樹(shù)狀導(dǎo)航結(jié)構(gòu)),除了能讓蜘蛛更好的爬行之外,最重要的是就是有利于用戶體驗(yàn),提升用戶粘性并讓用戶喜歡上你的網(wǎng)站才是

Public @ 2016-12-09 16:17:35

更多您感興趣的搜索

0.531196s