【黑帽SEO科普】泛内页、泛目录是什么意思?
回归黑帽SEO科普系列。
你到源码站去搜,发现一堆“泛XX”的代码,其中以“泛内页、泛目录”居多,那这是个什么东西?
看各种程序的介绍,非常niubility的样子。但站在小白的视角看来,依旧搞不懂是什么东西。
正常的网站,一个URL都对应唯一的关键词,比如我建立一个网站,设置2个url格式,一个列表页,一个详情页:
https://www.test1.com/{cid}/
https://www.test1.com/{cid}/{pid}.html
这个url结构,至少得创建两个数据表:
一个是cid--cname,存放“分类id和分类名称”的映射关系
一个是pid-cid,存放“某个文章和对应分类”的映射关系
cid是分类的id,pid是文章的id,每个pid对应唯一的title。哪个pid归属于哪个cid的映射关系,是写死在数据表里的。
只要你不改这个映射关系,每个pid详情页对应的title,永远是不变的。
而泛内页,是没有这个映射关系的。pid这个变量,你在浏览器随便写,都能正常访问,title一般是随机匹配的。
举几个栗子:
1)url不变,每次刷新,模板和title都变。模板和title与pid之间没有任何映射关系,随机匹配的。
2)但这样每次都变,对搜索引擎不友好。加上缓存,在一段时间内,让模板与title和pid绑定
如设置缓存86400秒,依旧url不变,N次刷新,模板和title不变
3)有些另类的url后缀是不能访问的,如.txt,.pdf,.xlxs.....
同理,通过创建新的url路由,来实现正常访问
4)任意url随机匹配关键词
同理,列表页这个cid,也没有映射关键词,url中的cid也可以随便输入,都能正常访问
简而言之,“泛XX”就是你随便输入url,都能正常访问。页面上出现的链接,都是程序随机生成的,随机就意味着无限大,baiduspider能发现无限大的未爬取的url,这样就有可能带来源源不断的抓取。
至于怎么随机,看程序的设置,可以“有范围的”随机,比如url必须符合某个格式,或者随机的id,必须是在某个列表内的才能访问等
有时候卖程序也会换个说法,叫“XX繁殖”,比如内页繁殖啥的,意思都差不多。
最近有小白看了一些程序的介绍,表示内心很激动,其实大可不必,SEO领域内,大多数情况下,程序都是次要的,即便再怎么“泛XX”,只是解决内容量的问题,但解决不了收录。
从功能的实现来讲,不难,基本上工作1、2年的php,把逻辑告诉他,都能实现一个差不多的程序。