日本少妇高潮久久久久久_东京热一区二区三区无码视频_国内精品人妻久久毛片app_男人撕开奶罩揉吮奶头视频_少妇交换做爰做到高潮_睡错了人妻公h_国产男女猛烈无遮挡a片漫画_男女啪啪做爰高潮全过有多钱_国产猛男猛女超爽免费视频

Categories


Tags


apache、iis6、ii7獨(dú)立ip主機(jī)屏蔽攔截蜘蛛抓取(適用vps云主機(jī)服務(wù)器)

如果是正常的搜索引擎蜘蛛訪問,不建議對蜘蛛進(jìn)行禁止,否則網(wǎng)站在百度等搜索引擎中的收錄和排名將會(huì)丟失,造成客戶流失等損失??梢詢?yōu)先考慮升級虛擬主機(jī)型號以獲得更多的流量或升級為云服務(wù)器(不限流量)。更多詳情請?jiān)L問: http://www.west.cn/faq/list.asp?unid=626

1. 使用網(wǎng)站管理助手環(huán)境:http://www.west.cn/faq/list.asp?unid=650 參考此說明啟用設(shè)置偽靜態(tài)組件

2.  windows2003+iis手工建站環(huán)境:http://www.west.cn/faq/list.asp?unid=639 參考此說明加載偽靜態(tài)組件

3.  然后在配置文件中按以下系統(tǒng)規(guī)則配置

Linux下 規(guī)則文件.htaccess(手工創(chuàng)建.htaccess文件到站點(diǎn)根目錄)

<IfModule mod_rewrite.c>

RewriteEngine On

#Block spider

RewriteCond %{HTTP_USER_AGENT}   "SemrushBot|Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|mail.RU|curl|perl|Python|Wget|Xenu|ZmEu"   [NC]

RewriteRule !(^robots\.txt$) - [F]

</IfModule>

windows2003下 規(guī)則文件httpd.conf

#Block spider

RewriteCond %{HTTP_USER_AGENT}   (SemrushBot|Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|mail.RU|curl|perl|Python|Wget|Xenu|ZmEu)   [NC]

RewriteRule !(^/robots.txt$) - [F]

windows2008下 web.config

<?xml version="1.0" encoding="UTF-8"?>

<configuration>

<system.webServer>

<rewrite>

<rules>

<rule name="Block spider">

<match url="(^robots.txt$)"   ignoreCase="false" negate="true" />

<conditions>

<add   input="{HTTP_USER_AGENT}"   pattern="SemrushBot|Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|curl|perl|Python|Wget|Xenu|ZmEu"   ignoreCase="true" />

</conditions>

<action   type="AbortRequest" />

</rule>

</rules>

</rewrite>

</system.webServer>

</configuration>

Nginx對應(yīng)屏蔽規(guī)則

代碼需添加到對應(yīng)站點(diǎn)配置文件server段內(nèi)

if ($http_user_agent ~ "Bytespider|Java|PhantomJS|SemrushBot|Scrapy|Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|mail.RU|perl|Python|Wget|Xenu|ZmEu|^$"   )

{

return 444;

}

注:規(guī)則中默認(rèn)屏蔽部分不明蜘蛛,要屏蔽其他蜘蛛按規(guī)則添加即可

附各大蜘蛛名字:

google蜘蛛:googlebot

百度蜘蛛:baiduspider

百度手機(jī)蜘蛛:baiduboxapp

yahoo蜘蛛:slurp

alexa蜘蛛:ia_archiver

msn蜘蛛:msnbot

bing蜘蛛:bingbot

altavista蜘蛛:scooter

lycos蜘蛛:lycos_spider_(t-rex)

alltheweb蜘蛛:fast-webcrawler

inktomi蜘蛛:slurp

有道蜘蛛:YodaoBot和OutfoxBot

熱土蜘蛛:Adminrtspider

搜狗蜘蛛:sogou spider

SOSO蜘蛛:sosospider

360搜蜘蛛:360spider

來源:西部數(shù)碼


Public @ 2018-06-02 16:22:26

百度不收錄原因分析——Spider抓取篇

目前百度Spider抓取新鏈接的途徑有兩個(gè),一是主動(dòng)出擊發(fā)現(xiàn)抓取,二就是從搜索資源平臺的鏈接提交工具中獲取數(shù)據(jù),其中通過主動(dòng)推送功能“收”上來的數(shù)據(jù)最受百度Spider的歡迎。對于站長來說,如果鏈接很長時(shí)間不被收錄,建議嘗試使用主動(dòng)推送功能,尤其是新網(wǎng)站,主動(dòng)推送首頁數(shù)據(jù),有利于內(nèi)頁數(shù)據(jù)的抓取。那么同學(xué)們要問了,為什么我提交了數(shù)據(jù)還是遲遲在線上看不到展現(xiàn)呢?那涉及的因素可就多了,在Spider抓取

Public @ 2012-08-02 15:38:46

Chrome瀏覽器模擬百度蜘蛛訪問

某些網(wǎng)站可能針對搜索引擎掛馬(百度/360/搜狗等),Chrome瀏覽器可以安裝User-Agent Switcher for Chrome模擬百度蜘蛛來訪問網(wǎng)頁,如果是針對搜索引擎掛馬的就會(huì)顯示。下載蜘蛛模擬軟件,模擬蜘蛛訪問查看非法信息。準(zhǔn)備工作已經(jīng)安裝Google Chrome瀏覽器安裝擴(kuò)展訪問 User-AgentSwitcher_1_0_43.crx 并下載這個(gè)擴(kuò)展按照下圖打開Chrom

Public @ 2019-10-16 16:22:26

如何查看網(wǎng)站被百度抓取的情況?

百度用于抓取網(wǎng)頁的程序叫做Baiduspider - 百度蜘蛛,我們查看網(wǎng)站被百度抓取的情況主要是分析,網(wǎng)站日志里百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態(tài)碼。如何查看網(wǎng)站被百度抓取的情況?查看日志的方式:通過FTP,在網(wǎng)站根目錄找到一個(gè)日志文件,文件名一般包含log,下載解壓里面的記事本,這即是網(wǎng)站的日志,記錄了網(wǎng)站被訪問和操作的情況。因?yàn)楦鱾€(gè)服務(wù)器和主機(jī)的情況不同,不

Public @ 2022-04-18 16:22:33

apache、iis6、ii7獨(dú)立ip主機(jī)屏蔽攔截蜘蛛抓取(適用vps云主機(jī)服務(wù)器)

針對apache、iis6、iis7獨(dú)立ip主機(jī)屏蔽攔截蜘蛛抓取的方法如下: 1. 在網(wǎng)站根目錄下新建一個(gè)robots.txt文件,添加以下代碼: User-agent: * Disallow: / 這樣可以禁止所有蜘蛛抓取你的網(wǎng)站。 2. 在服務(wù)器端安裝mod_security模塊并配置,可以使用以下命令: sudo apt-get install libapache-mod-secu

Public @ 2023-03-30 01:00:40

更多您感興趣的搜索

0.507613s