如何判斷是否冒充Baiduspider的抓取?
建議您使用DNS反向查找和DNS正向查找相結(jié)合的方式來確定抓取來源的ip是否屬于百度,根據(jù)平臺不同驗證方法不同,如linux/windows/os三種平臺下的驗證方法分別如下:
6.1 在linux平臺下:(1)使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。(2)使用host命令對第一步中的檢索到的域名運行DNS正向查找,驗證該域名與訪問服務(wù)器的原始ip地址是否一致。
示例1:
$ host 123.125.66.120 120.66.125.123.in-addr.arpa domain name pointer baiduspider-123-125-66-120.crawl.baidu.com.
$ host baiduspider-123-125-66-120.crawl.baidu.com
baiduspider-123-125-66-120.crawl.baidu.com has address 123.125.66.120
示例2:
$host 119.63.195.254
254.195.63.119.in-addr.arpa domain name pointer BaiduMobaider-119-63-195-254.crawl.baidu.jp.
$host BaiduMobaider-119-63-195-254.crawl.baidu.jp
BaiduMobaider-119-63-195-254.crawl.baidu.jp has address 119.63.195.254
6.2 在windows平臺或者IBM OS/2平臺下:(1)使用nslookup ip命令反解ip來 判斷是否來自Baiduspider的抓取。打開命令處理器 輸入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充。(2)使用 nslookup命令對第一步中檢索到的域名進行DNS正向查找,驗證該域名與訪問服務(wù)器的原始ip地址是否一致。
6.3 在mac os平臺下:(1)使用dig 命令反解ip來判斷是否來自Baiduspider的抓取。打開命令處理器 輸入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip,來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即為冒充;(2)使用 dig命令對第一步中檢索到的域名進行DNS正向查找,驗證該域名與訪問服務(wù)器的原始ip地址是否一致。