如何查看一个网站是什么程序做的?

Author: 陌小雨Date: 2015-05-06View: 444

jianzhanchenxu

在互联网里飘来飘去,偶尔会看到几个自己喜欢的网站,这时候想建一个类似的网站,但是我们又不知道目标网站是用什么程序做的,怎么办呢?根据陌小雨我的个人经验,我们可以通过robots文件来看目标网站是什么程序做的,但是这个方法有时候不好使,但有时候也很奏效。

查看网站robots的方法:一般在网址后面加/robots.txt就可以查看该网站的robots了,如陌小雨的就是https://dedewp.com/robots.txt

我们看下面一个网站的robots.txt文件:

# 
# robots.txt for EmpireCMS 
# 
User-agent: * *允许所有搜索引擎抓取 
Disallow: /d/ *禁止所有搜索引擎抓取D目录 
Disallow: /e/class/ *禁止所有搜索引擎抓取/e/class/ 目录 
Disallow: /e/data/ *禁止所有搜索引擎抓取/e/data/ 目录 
Disallow: /e/enews/ *禁止所有搜索引擎抓取/e/enews/ 目录 
Disallow: /e/update/ *禁止所有搜索引擎抓取/e/update/ 目录

从robots中的注释robots.txt for EmpireCMS我们可以看到这个网站应该是empirecms(帝国cms)做的,那么我们就可以用帝国cms去做个同样的网站了,再比如说:

User-agent: *
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-includes
Disallow: /s=
Sitemap: http://www.***.com/sitemap.xml

从上面的robots中的Disallow:/wp-admin这句就可以很明显的看出来这个程序是wordpress,知名的博客程序。

如果是类似下面的,就是很典型的织梦robots写法,标志就是/plus

User-agent: * 
Disallow: /plus/feedback_js.php
Disallow: /plus/feedback.php
Disallow: /plus/mytag_js.php
Disallow: /plus/rss.php
Disallow: /plus/search.php
Disallow: /plus/recommend.php
Disallow: /plus/stow.php
Disallow: /plus/count.php
Disallow: /include
Disallow: /templets
Disallow: /member

discuz论坛的robots.txt文件写法类似下面这样

User-agent: *  
Allow: /redirect.php  
Allow: /viewthread.php  
Allow: /forumdisplay.php  
Disallow: /  
Disallow: /*.php

phpcms建站的robots.txt文件写法一般是这样子的

User-agent: * 
Disallow: /admin
Disallow: /data
Disallow: /templates
Disallow: /include
Disallow: /languages
Disallow: /api
Disallow: /fckeditor
Disallow: /install
Disallow: /count.php
Disallow: /comment
Disallow: /guestbook
Disallow: /announce
Disallow: /member
Disallow: /message
Disallow: /spider
Disallow: /yp
Disallow: /vote
Disallow: /video

当然有时候很多网站没有robots文件,这时候我们还可以去页面的底部或者去页面源代码看看是不是有透露网站程序的信息,只要你细心就能发现更多的方法去查看一个已经发布的网站是用什么程序做的。那么问题来了,下面的robots你们说是用什么程序做的?

User-Agent: *
Disallow: /**
Disallow: /member
Disallow: /system
Disallow: /explorer
Disallow: /*.php$
Disallow: /roll*
Disallow: /rssfeed
Disallow: /search/*
Disallow: /ico