在互联网里飘来飘去,偶尔会看到几个自己喜欢的网站,这时候想建一个类似的网站,但是我们又不知道目标网站是用什么程序做的,怎么办呢?根据陌小雨我的个人经验,我们可以通过robots文件来看目标网站是什么程序做的,但是这个方法有时候不好使,但有时候也很奏效。
查看网站robots的方法:一般在网址后面加/robots.txt就可以查看该网站的robots了,如陌小雨的就是https://dedewp.com/robots.txt
我们看下面一个网站的robots.txt文件:
# # robots.txt for EmpireCMS # User-agent: * *允许所有搜索引擎抓取 Disallow: /d/ *禁止所有搜索引擎抓取D目录 Disallow: /e/class/ *禁止所有搜索引擎抓取/e/class/ 目录 Disallow: /e/data/ *禁止所有搜索引擎抓取/e/data/ 目录 Disallow: /e/enews/ *禁止所有搜索引擎抓取/e/enews/ 目录 Disallow: /e/update/ *禁止所有搜索引擎抓取/e/update/ 目录
从robots中的注释robots.txt for EmpireCMS我们可以看到这个网站应该是empirecms(帝国cms)做的,那么我们就可以用帝国cms去做个同样的网站了,再比如说:
User-agent: * Disallow: /wp-admin Disallow: /wp-content/plugins Disallow: /wp-content/themes Disallow: /wp-includes Disallow: /s= Sitemap: http://www.***.com/sitemap.xml
从上面的robots中的Disallow:/wp-admin这句就可以很明显的看出来这个程序是wordpress,知名的博客程序。
如果是类似下面的,就是很典型的织梦robots写法,标志就是/plus
User-agent: * Disallow: /plus/feedback_js.php Disallow: /plus/feedback.php Disallow: /plus/mytag_js.php Disallow: /plus/rss.php Disallow: /plus/search.php Disallow: /plus/recommend.php Disallow: /plus/stow.php Disallow: /plus/count.php Disallow: /include Disallow: /templets Disallow: /member
discuz论坛的robots.txt文件写法类似下面这样
User-agent: * Allow: /redirect.php Allow: /viewthread.php Allow: /forumdisplay.php Disallow: / Disallow: /*.php
phpcms建站的robots.txt文件写法一般是这样子的
User-agent: * Disallow: /admin Disallow: /data Disallow: /templates Disallow: /include Disallow: /languages Disallow: /api Disallow: /fckeditor Disallow: /install Disallow: /count.php Disallow: /comment Disallow: /guestbook Disallow: /announce Disallow: /member Disallow: /message Disallow: /spider Disallow: /yp Disallow: /vote Disallow: /video
当然有时候很多网站没有robots文件,这时候我们还可以去页面的底部或者去页面源代码看看是不是有透露网站程序的信息,只要你细心就能发现更多的方法去查看一个已经发布的网站是用什么程序做的。那么问题来了,下面的robots你们说是用什么程序做的?
User-Agent: * Disallow: /** Disallow: /member Disallow: /system Disallow: /explorer Disallow: /*.php$ Disallow: /roll* Disallow: /rssfeed Disallow: /search/* Disallow: /ico