今天是《GoogleSeo,每天五分钟轻松学会》第十课,主讲网站站点地图设置,因为规范化的网站地图设置,能够更好的利于Google抓取工具抓取网站的文件,其中包括文本内容、图片,视频等文件,从而更好的收录页面,获取排名及流量。
一、网站地图原理1、官方解释站点地图是一种文件,您可在其中提供与您网站中的网页、视频或其他文件有关的信息,也可以说明这些内容之间的关系。Google等搜索引擎会读取此文件,以便更高效地抓取您的网站。站点地图会告诉搜索引擎您认为网站中的哪些网页和文件比较重要,还会提供与这些文件有关的重要信息。例如,网页上次更新的时间和网页是否有任何备用的语言版本。
也就是说,站点地图,它是我们主要用来制作给爬虫看的网站详细文档,里面有多少文件,页面更新时间,哪些页面比较重要等等都详细记载在站点地图里面,爬虫根据这个地图文件就可以更有目标性的去爬取收录网站的页面及相对应文件。如果没有这个站点地图,爬虫就像失去了目标一样,只能通过站内的链接进行爬取页面,这时候,就会导致有些页面不会被爬虫爬取到,严重会导致有些页面长期不被搜索引擎收录,尤其是大的网站,影响会更大。2、站点地图格式①、XML网站地图一般我们口头说的网站地图大部分指的就是XML站点地图。XML网站地图是目前用途最广的站点地图格式,可以包含图片、视频和新闻内容的等多样化文件。②、HTML站点地图HTML站点地图主要是给用户看的,你可以把他理解成一个页面,把网站所有的链接综合分类在一起,可以帮助用户快速了解网站目录结构以及方便访问网站任一页面。样式参考:
苹果网站站点地图微软网站站点地图
③、RSS、mRSS和Atom1.0站点地图
在结构上与XML站点地图类似,一般CMS会自动创建这些站点地图,然后可以将Feed的网址作为站点地图提交。④、文本站点地图
这种就相对简单,就是创建一个sitemap.txt的文本文件,然把网址放入里面即可。例如: