蜘蛛池-关于网站结构&目录结构搭建的友好提示

频道:蜘蛛池经验 日期: 浏览:301

教授针对网站结构搭建&目录搭建再次做出强调,直接上三个图,来说明问题。

正面案例分析:网站建议按照扁平化效果搭建,如果网站自身内容较少,可以按照目录方式搭建;如果单个目录下内容很多,可以分成独立的二级域/频道



负面案例一:目录层级过深,不利于蜘蛛抓取



负面案例二:所有内容都在主域下,无任何区分,也是不友好的行为



关于网站URL设计的友好提示



关于网站的URL设计,虽然很少有人问到院长,但是,院长却见过了各种各样五花八门的URL,现在,院长和大家聊聊什么是友好的URL设计

1、在搭建网站结构、制作URL时,尽量避开非主流设计,追求简单美即可, 越简单越平常,越好

2、不建议URL中含有中文字符,中文字符容易出现识别问题

3、URL长度要求从www开始到结束,总长度不超过1024个字节

4、避免无效参数,如ll等

5、谨慎使用#参数,有可能会被爬虫截断,导致井号后面的url字符不生效,最终效果是网页抓取失败

6、避免出现太多无效目录,目录不宜过深,否则会影响链接层级计算,如www.abc.com/a/news/difang/123,URL结构太深不利于抓取

 

以上是院长根据目前看到的网站case总结,后续如还有新的case,会持续补充。

参考案例:

SEO不是事后工作,在站点在建设之初就要考虑到如何对搜索引擎友好。在院长看来,与其出手阔绰、花大价钱买个域名,不如找个经验丰富的SEO人员在站点结构等基础工作上多下工夫——这期院长帮帮忙,说的正是一个大家容易忽略的细节问题:url构成。先说结论吧:url构成(或者叫url规则)越简单越平常,百度处理起来越顺畅,越容易正确生效。

院长收到的case是这样的,站长反应:跳转适配的PC页和移动页,内容可以做到一一对应,通过移动适配工具提交了规则适配,但一直无法正确生效。



  示例链接:http://www.123456.cn/zjj/teacher/p1ll111001

  示例正则式:

  http://www.123456.cn/(\w+)/teacher/p1ll(\d+)——

  http://m.123456.cn/teacher/${1}/s${2}

院长在检查了页面对应的确无误的情况下,请工程师查看,结论如下:移动适配部门在计算PC站点的pattern(规则)时,分割符没有考虑ll,导致计算出的数据有问题。简单说,此站点每个URL中都出现的、极少有网站使用的ll干扰了适配计算,导致适配无法正确生效。

工程师解释说,“在考虑分隔符时,出于成本的考虑,只顾及到了常见的url分隔符,像ll这种非常罕见的,暂时没有考虑,后续升级时再统一安排。

可能很多同学觉得,单从这个case讲是百度的一个badcase——我个人也承认这一点。但大家应该都知道,世上没有十全十美的策略,任何一个接近完美的策略都是不断迭代的结果。在我们日常的生活和工作中,也往往都会利用“最小成本获得最大收益”的思维来解决问题,百度的工程师也不例外。所以请给我们的策略一些时间,同时建议大家在搭建网站结构、制作URL时,尽量避开非主流设计,追求简单美即可。