目前很多人把Google的蜘蛛程序Spider称为网络爬虫,搜索引擎机器人,Google的蜘蛛程序实质上是指对网页数据的抓取是通过读取网页文本内容,并顺着页面中的链接层层深入,从而获得对全站内容的抓取。有一些网页制作技术如框架结构(frame:帧)、Flash等生成的网页内容是蜘蛛程序比较排斥、不愿意抓取的,因此内嵌于其中的文字或链接往往被蜘蛛忽略了,从而影响到对全站重要数据的抓取。要想知道某个网页的内容能否被Google蜘蛛正常抓取到,可以借用蜘蛛Spider模拟程序,它罗列出一页中能够读到的所有文本,以及能够进入的所有链接,以帮助诊断重要网页内容是否可见。网络营销指南将搜索引擎蜘蛛模拟器视作重要的搜索引擎优化检测工具之一。
下一篇:[SEO工具]
与本文相关文章推荐




