做SEO,一定要知道搜索引擎,搜索引擎用來(lái)爬行和訪問(wèn)頁(yè)面的程序被稱為蜘蛛(spider),也稱為機(jī)器人(bot)。 搜索引擎蜘蛛訪問(wèn)網(wǎng)站頁(yè)面時(shí)類似于普通用戶使用的瀏覽器。蜘蛛程序發(fā)出頁(yè)面訪問(wèn) 請(qǐng)求后,服務(wù)器返回HTML代碼,蜘蛛程序把收到的代碼存入原始頁(yè)面數(shù)據(jù)庫(kù)。搜索引擎 為了提高爬行和抓取速度,都使用多個(gè)蜘蛛并發(fā)分布爬行。
蝴蛛訪問(wèn)任何一個(gè)網(wǎng)站時(shí),都會(huì)先訪問(wèn)網(wǎng)站根目錄下的robots.txt文件。如果robots.txt 文件禁止搜索引擎抓取某些文件或目錄,蜘蛛將遵守協(xié)議,不抓取被禁止的網(wǎng)址。
和瀏覽器一樣,搜索引擎蜘蛛也有標(biāo)明自己身份的代理名稱,站長(zhǎng)可以在日志文件中 看到搜索引擎的特定代理名稱,從而辨識(shí)搜索引擎蜘蛛。下面列出常見(jiàn)的搜索引擎蜘蛛 名稱:
• Baiduspider+(+http://www.baidu.com/search/spider.htm)百度蝴蛛
• Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html) 雅虎中國(guó)蜘蛛
• Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp) 英文雅虎蜘蛛
• Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) Google 蝴蛛
• msnbot/1.1 (+http://search.msn.com/msnbot.htm)微軟 Bing 蝴蛛
• Sogou+web+robot+(+http://www.sogou.com/docs/help/webmasters.htm#07)搜狗蝴蛛
• Sosospider+(+http://help.soso.com/webspider.htm)搜搜蝴蛛
• Mozilla/5.0 (compatible; YodaoBot/1.0; http://www.yodao.com/help/webmaster/spider/;) 有道蜘蛛 |