网站就像是一张网,而百度蜘蛛就是根据网站这张网的结构来对网站进行抓取,一般的网站结构形式分为两种,一种为树形结构,另一种为扁平结构,这些都是属于比较利于网站进行优化的,但是要注意一点,在对网站进行优化的时候,一定要注意到网站的内页url路径层级,如果链接层级过深,是不利于网站抓取以及优化的,今天就来为大家先容一下url的种类以及如何区分。

  一、url种类

  1.静态url

  静态url的每一个页面都是真实存在的,每一个静态的url页面内容都是固定的,不会因为其它页面的内容改变而改变,另外静态url页面也是属于容易被搜索引擎抓取收录的页面。

  2.动态url

  动态url页面不同于静态页面,动态页面内容会随着网站某个地方的内容改变而改变,可以很大程度上节省时间效率,因为修改一个地方,其它页面就会做出相对应的改变,但是动态页面想比静态页面不利于搜索引擎抓取,并且动态的url路径一般比较长,所以在抓取方面也给百度蜘蛛制造出了困难。

  3.伪静态url

  第三种就是伪静态的url页面,伪静态页面介于动态页面与静态页面之前,算是吸纳了另外两种页面的优点,可以修改为调用统一调取,也可以锁定某一个页面不让其发生改变,所以还是比较不错的页面。

  二、区分url层级以及页面类型

  网站URL的层级不要超过5层,最好的状态是三层,网站的域名属于根,不算层级。

  层级过多的话,不利于搜索引擎的抓取,上面也说了,动态页也不利于搜索引擎的抓取,静态和伪静态利于抓取。下面就说一下如何区分url层级以及如何区分动态、静态、伪静态页面。

  1.区分url层级:

  例:

  三层:

  http://www./1/2/3

  五层:

  http://www./1/2/3/4/5

  URL越简短越好抓取

  2.区分动态、静态、伪静态页面:

  动态页:有一个问号的

  http://www./1/....?.....

  静态和伪静态:页面都有一个固定的URL,且网页URL以.htm、.html、.shtml等常见形式为后缀,而不含有“?”。

url的种类如何区分以及url展现形式