robots文件中屏蔽的為什么還可以收錄?
- 威海網站結構優(yōu)化 威海Robots
- 1409
robots.txt 是一個標準,它通過提供一些規(guī)則,告訴搜索引擎爬蟲哪些網頁可以被爬取,哪些網頁不應該被爬取。但是,一些搜索引擎爬蟲可能會忽略這些規(guī)則,直接抓取它們想要的網頁。 此外, robots.txt 文件的存在只是一個建議而不是命令。在一些情況下,搜索引擎爬蟲可能會收錄被 robots.txt 文件所屏蔽的網頁,這有可能是因為發(fā)布這個網頁的人想要讓它被收錄,也有可能是因為機器人誤解了 robots.txt 文件。 因此,網站所有者仍然需要使用其他策略,如更新網頁的元標記和標題標簽,以及在頁面上指示搜索引擎不索引。