如何查看自己網(wǎng)站是否有蜘蛛來過

2020-04-05 11:34:20 編輯：永諾網(wǎng)絡來源：本站原創(chuàng)

什么是baiduspider？
baiduspider是百度搜索引擎的一個自動程序。它的作用是訪問互聯(lián)網(wǎng)上的html網(wǎng)頁，建立索引數(shù)據(jù)庫，使用戶能在百度搜索引擎中搜索到您網(wǎng)站的網(wǎng)頁。

baiduspider對一個網(wǎng)站服務器造成的訪問壓力如何？
baiduspider會自動根據(jù)服務器的負載能力調節(jié)訪問密度。在連續(xù)訪問一段時間后，baiduspider會暫停一會，以防止增大服務器的訪問壓力。所以在一般情況下，baiduspider對您網(wǎng)站的服務器不會造成過大壓力。

為什么baiduspider不停的抓取我的網(wǎng)站？
對于您網(wǎng)站上新產生的或者持續(xù)更新的頁面，baiduspider會持續(xù)抓取。此外，您也可以檢查網(wǎng)站訪問日志中baiduspider的訪問是否正常，以防止有人惡意冒充baiduspider來頻繁抓取您的網(wǎng)站。如果您發(fā)現(xiàn)baiduspider非正常抓取您的網(wǎng)站，請反饋至webmaster@baidu.com，并請盡量給出baiduspider對貴站的訪問日志，以便于我們跟蹤處理。

我不想我的網(wǎng)站被baiduspider訪問，我該怎么做？
baiduspider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止baiduspider訪問您的網(wǎng)站，或者禁止baiduspider訪問您網(wǎng)站上的部分文件。注意：禁止baiduspider訪問您的網(wǎng)站，將使您的網(wǎng)站上的網(wǎng)頁，在百度搜索引擎以及所有百度提供搜索引擎服務的搜索引擎中無法被搜索到。
關于robots.txt的寫作方法，請參看我們的介紹：robots.txt寫作方法

為什么我的網(wǎng)站已經(jīng)加了robots.txt，還能在百度搜索出來？
因為搜索引擎索引數(shù)據(jù)庫的更新需要時間。雖然baiduspider已經(jīng)停止訪問您網(wǎng)站上的網(wǎng)頁，但百度搜索引擎數(shù)據(jù)庫中已經(jīng)建立的網(wǎng)頁索引信息，可能需要二至四周才會清除。另外也請檢查您的robots配置是否正確。

百度蜘蛛在robots.txt中的名字是什么？
“baiduspider”全部為小寫字母。

baiduspider多長時間之后會重新抓取我的網(wǎng)頁？
百度搜索引擎每周更新，網(wǎng)頁視重要性有不同的更新率，頻率在幾天至一月之間，baiduspider會重新訪問和更新一個網(wǎng)頁。

知道了什么是百度蜘蛛，那么怎么才能知道蜘蛛是否來過你的站？這個可以從你服務器或者虛擬主機的日志中看出來，比如我用的虛擬主機的完整使用日志中有這樣的記錄：

220.181.38.198 - - [11/Nov/2007:04:28:29 +0800] "GET / HTTP/1.1" 200 61083 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"這就說明百度蜘蛛來過我的站了，如果你還想知道有沒有其它搜索引擎的蜘蛛來過你的站，你可以在日志文件中搜索“spider”這個詞，或者搜索蜘蛛的IP，我的就查到sogou也來過我的站，IIS日志與Apache的日志是一樣的，都可以查到。

本站文章均為永諾網(wǎng)站建設摘自權威資料，書籍，或網(wǎng)絡原創(chuàng)文章，如有版權糾紛或者違規(guī)問題，請即刻聯(lián)系我們刪除，我們歡迎您分享，引用和轉載，我們謝絕直接復制和抄襲！感謝...

返回首頁上一篇：apache重寫規(guī)則下一篇：DedeCMS用channelartlist調用頂級欄目及列表