国内很多站长都比较偏爱Google的pagerank,小小的绿色指数迷倒了万千站长,令绝大多数站长在合作的时候见到PR数值高、绿色多的网站就眼冒金光。
在这个专题我们着重要说的就是PR劫持,也就是用欺骗手段获得较高的PR值、获得较长的绿色条状显示。PR劫持的方法简单地说是利用跳转。
方法一:一般搜索引擎在处理301和302转向的时候,都是把目标URL当作实际应该收录的URL。所以,如果你从域名A做“301或302跳转”到域名B,而域名B的PR值比较高,域名A在PR更新后,也会显示域名B的PR值。有人就利用这一点,把自己的域名PR值刻意提高。
最简单的就是先做301或302跳转到高PR的域名B,等PR更新过后,立刻取消转向,放上自己的内容,然后开始卖链接。这个做假的PR显示值至少维持到下一次PR更新,一般有两三个月时间。
其他站长来到这个网站,看到的是一个高PR值,却不知道这个PR值是通过转向得到的,不是这个网站的PR值,而是另外一个网站的。
方法二:更隐讳一点的办法是,通过程序检测到Google蜘蛛,返回301或302转向,对普通访问者和其他蜘蛛都返回正常内容。这样我们看到的是普通网站,只有Google会看到转向。
比如下面这段PHP代码就可以达到这个效果:
if (strstr($_SERVER['HTTP_USER_AGENT'], “Googlebot”)) {
header(”HTTP/1.1 301 Moved Permanently”);
header(”Location: http://www.wangluning.com/”);
exit;
}
else {
header(’Content-Type: text/html; charset=ISO-8859-1′);
};
?>
这里开始普通HTML码
我不懂编程,上面只是大概意思,不一定准确。懂PHP的人一看就知道该怎么写了。
这两种手段得到的PR值,都不是自己域名真实的PR值。一般这样得到PR值的人的目的也很明显,就是为了卖链接,卖PR。如果卖链接的诉求是广告性的直接点击流量,还有情可原,如果主要诉求或唯一诉求就是高PR值,这无疑就是欺骗。这种网站上的链接对PR值没有任何贡献。
那么怎样鉴别这种欺骗得来的PR值呢?
最准确的当然就是看Google的网页快照,如果你看到的网页是一个样,Google快照看到的却是另外一个网站,一般网站标题和logo都会显示出来,这恐怕就非常可疑了。
另外一个值得注意的是,在寻找和买链接的时候,如果对方炫耀的就是高PR值,都要非常小心。建立链接应该以内容的相关性为最主要的考量,PR高低对实际排名影响没有很多人想象的那么重要。
相关说明:
什么是301转向?
301转向(或叫301重定向,301跳转)是当用户或搜索引擎向网站服务器发出浏览请求时,服务器返回的HTTP数据流中“头信息(header)”中的状态码的一种,表示本网页永久性转移到另一个地址。
其它常见的状态码还包括,200表示一切正常,404网页找不到,302暂时转向,等等。
为什么要做网址转向?
除了网址规范化问题外,还有很多需要做网址转向的情形。比如,为保护版权,你拥有不同TLD的多个域名:
wangluning.com
wangluning.cn
wangluning.net
wangluning.org
wangluning.com.cn
等等。
很自然这些域名全部指向一个网站。如用wangluning.com为主域名,其它域名就可以转向到wangluning.com。
或者你注册了公司全称域名wangluning.com但太长 ,你也注册了缩写域名方便用户记住wln.cn,其中一个做主域名,另一个就可以转向到主域名。
为什么要用301转向?
网址转向方法主要包括:301转向,302转向,JavaScript转向,PHP/ASP/CGI转向,META REFRESH网页META刷新,等。302转向可能会有URL规范化问题。其它方法都是常用的作弊手法,当然不是说不可以正当地用,方法本身没有错,但被作弊者用多了,搜索引擎对这些可疑的转向都很敏感。何必冒险呢。
当网页A用301重定向转到网页B时,搜索引擎可以肯定网页A永久的改变位置,或者说实际上不存在了,搜索引擎就会把网页B当作唯一有效目标。好处是,第一,没有网址规范化问题,第二,也很重要的,网页A的PR网页级别会传到网页B。
很多时候其它网站会链接到
http://wangluning.com
http://www.wangluning.com/index.html
http://wangluning.com/index.html
而不是你希望的
http://www.wangluning.com
这样链接的PR也会传递到所有URL,如果你用301转向把前三个URL转到
http://www.wangluning.com
PR也就集中在网页http://www.wangluning.com了。
怎样判断网站有网址规范化问题?
英语中有句话,东西没坏就别修理。很多网站没做301转向排名也没影响,那就别动它。
如果你觉得网站排名没有预想的好,可以看看是否有网址规范化问题:
1) 查一下这些URL是否都有差不多的PR值和网页快照:
http://wangluning.com
http://www.wangluning.com/index.html
http://wangluning.com/index.html
http://www.wangluning.com
如果是,那可能有问题。
2)搜一下site:wangluning.com看是否结果中有多个主页版本。
怎样做301转向
如果你用的是Unix/Linux主机,可以用文件(Unix/Linux中用于目录特定指令如密码,转向,错误处理等的文件)。
比如把/old.htm转到http://www.wangluning.com/new.htm,可以用这个指令:
redirect 301 /old.htm http://www.wangluning.com/new.htm
或
redirect permanent /old.htm http://www.wangluning.com/new.htm
如果要把所有http://wangluning.com形式的URL用301重定向转到 http://www.wangluning.com,包括:
http://wangluning.com/about.htm
转到 http://www.wangluning.com/about.htm
及
http://wangluning.com/dir/index.htm
转到 http://www.wangluning.com/dir/index.htm
等等,还要用到mod_rewrite:
Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} ^pifa7.com [NC]
RewriteRule ^(.*)$ http://www.wangluning.com/$1 [L,R=301]
如果你用的是 Windows主机,应该在控制面板做301转向设定。
补充 :
据我所知,HTML无法做301转向。在HTML里只能做JS或META REFRESH,但不是301转向。HTML一被读取,就已经返回200 OK状态码了。
如果你的页面是ASP或PHP还可以做301转向:
ASP:
<%@ Language=VBScript %>
<%
Response.Status=”301 Moved Permanently” Response.AddHeader “Location”, ” http://www.domain.com”
>
PHP:
Header( “HTTP/1.1 301 Moved Permanently” );
Header( “Location: http://www.domain.com” );
?>
另外,DOThtaccess文件只是一个普通文字文件,你用Notepad建这个文件,放上指令,存在你帐号的根目录下就行了。不需要修改Apache。
什么是302专项与网志劫持?
302转向或者302重定向(302 redirect)指的是当浏览器要求一个网页的时候,主机所返回的状态码。302状态码的意义是暂时转向到另外一个网址。
另一个更常见的状态码是404错误(404 error),404错误或404状态码指的是网页不存在。
另一个和302状态码相关的是301重定向(301 redirect),301重定向指的是本网页永久性的转移到另外一个位置。301和302的区别就在于301是永久性重定向,302是暂时重定向。
302重定向和网址劫持(URL hijacking)有什么关系呢?这要从搜索引擎如何处理302转向说起。从定义来说,从网址A做一个302重定向到网址B时,主机服务器的隐含意思是网址A随时有可能改主意,重新显示本身的内容或转向其他的地方。大部分的搜索引擎在大部分情况下,当收到302重定向时,一般只要去抓取目标网址就可以了,也就是说网址B。
实际上如果搜索引擎在遇到302转向时,百分之百的都抓取目标网址B的话,就不用担心网址URL劫持了。
问题就在于,有的时候搜索引擎,尤其是Google,并不能总是抓取目标网址。为什么呢?比如说,有的时候A网址很短,但是它做了一个302重定向到B网址,而B网址是一个很长的乱七八糟的URL网址,甚至还有可能包含一些问号之类的参数。很自然的,A网址更加用户友好,而B网址既难看,又不用户友好。这时Google很有可能会仍然显示网址A。
由于搜索引擎排名算法只是程序而不是人,在遇到302重定向的时候,并不能像人一样的去准确判定哪一个网址更适当,这就造成了网址URL劫持的可能性。也就是说,一个不道德的人在他自己的网址A做一个302重定向到你的网址B,出于某种原因, Google搜索结果所显示的仍然是网址A,但是所用的网页内容却是你的网址B上的内容,这种情况就叫做网址URL劫持。你辛辛苦苦所写的内容就这样被别人偷走了。
如果你遇到你自己的网站网址被劫持的时候,在你自己这一方面并没有什么办法,你只能向Google汇报。
判断PR劫持的目标网站的方法
PR劫持应该大家都知道什么意思(不知道什么意思这个文章也就没必要看了),今天遇到一个网友说网站PR6,而首页才PR3,感觉有问题,就查看了一下。
如何鉴别PR劫持并判断PR劫持的目标网站
方法一:看Google的网页快照,如果你看到的网页是一个样,Google快照看到的却是另外一个网站,一般网站标题和logo都会显示出来,这恐怕就非常可疑了。网站快照里面的那个网站就是PR劫持的目标网站。
该方法的缺陷:只要该网站劫持结束后更新到自己的网站,Google会重新收录新网站,那这个时候就看不出原来网站的痕迹,那就无法确认PR是否劫持,更无法知道劫持的哪个网站了。该方法只适用于劫持目标网站后转换到自己的网站不久。
方法二:其实也很简单,就是查看反向链接,再根据反向链接来判断真实的网站是哪个。举个例子说明一下。
刚才找了一下我自己的一个,已经被GG识别出来了,被处理掉了。只能拿一个网友的不知道的情况下造成的劫持来说明一下情况。
该网友的域名是it.xxxxx.com(域名隐藏了,非故意想劫持PR,就不点名了),xxxxx.com的PR是4,而it.xxxxx.com的PR是6,虽然这个是真实的可能性是比较大的,还是习惯性的查了一下。发现it的二级域名疑似PR劫持。
登陆google,在搜索框中输入:link:it.xxxxx.com,搜索结果中的网站就是向该网站提供反向链接的,任意打开一个,在里面查找it.xxxxx.com的链接,没有发现。再随机找几个,依然没有发现。这就说明该站的PR是劫持的(如果想增加这个判断结果的可信度,可以多找几个网站)。
第一步确定了该网站是PR劫持,下面就是查找该网站劫持的哪个网站的PR。查找网站的就需要一定的经验了,方法是这样看的:看link出来的结果中哪个站的结果比较多,一般就是这个网站。因为link的结果中与被劫持PR的网站link是一样的,而被劫持PR的网站内页链接到主域名的比较多,所以一般结果比较多的那个站就是被劫持的网站。
我们在刚才的结果中看到有大量的来自it.com.cn的内容,所以初步判断该网站是劫持的it.com.cn的PR。
第二步就是验证刚才的判断结果了,方法很简单。用link:it.xxxxx.com和link:it.com.cn比较,如果是一样的,那就说明判断是正确的。在google中输入link:it.xxxxx.com,看查询结果;再输入link:it.com.cn,看查询结果。
两者搜索结果完全一样,所以可以肯定的说,it.xxxxx.com是劫持的it.com.cn的PR。
(作者:张杭峰)

