<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>搜索引擎优化SEO每天一贴&#187; Google排名技术研究 &#8211; 搜索引擎优化SEO每天一贴</title>
	<atom:link href="http://www.chinamyhosting.com/seoblog/category/google/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.chinamyhosting.com/seoblog</link>
	<description>介绍和研究世界最先进搜索引擎优化SEO技术。我的目标是每天都总结国际上搜索引擎排名研究的最新动态。 --Zac</description>
	<lastBuildDate>Tue, 16 Mar 2010 07:43:54 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>SEO每天一贴和seobbs的Google排名现象</title>
		<link>http://www.chinamyhosting.com/seoblog/2009/09/16/seo-seobbs-ranking/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2009/09/16/seo-seobbs-ranking/#comments</comments>
		<pubDate>Tue, 15 Sep 2009 19:16:18 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/?p=1049</guid>
		<description><![CDATA[本博客SEO每天一贴和樂思蜀的seobbs.net，在google中搜索“SEO”时排名一直跳动。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2009/09/16/seo-seobbs-ranking/">SEO每天一贴和seobbs的Google排名现象</a></p>
]]></description>
			<content:encoded><![CDATA[<p>近两个月注意到一个有意思的现象。</p>
<p>本博客SEO每天一贴和樂思蜀的<a href="http://www.seobbs.net/" target="_blank">seobbs.net</a>，在google中搜索“SEO”时排名一直跳动。我的SEO每天一贴通常是在第一页和第六页间跳，在第一页的时间少，在第六页的时间多。seobbs.net则通常在第一页和第三页跳。</p>
<p>两个网站都跳回第一页时，通常是挨在一起，排在第7和第8位，就像此时此刻。</p>
<p><img class="alignnone size-full wp-image-1050" title="Google排名变动" src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2009/09/yoyo.gif" alt="Google排名变动" width="400" height="374" /></p>
<p>很可能读者看到这篇帖子时，这两个网站又跳后面去了。</p>
<p>观察到几个排名变化的共同特点。</p>
<p>一是，两个网站跳到前面时都没有快照，跳到后面时都有快照。这是最奇怪也最明显的地方 &#8211; 快照和排名变动（也许是排名惩罚）显然有关系，但逻辑和原因是什么？想不通。</p>
<p>二是，这两个网站都被dmoz收录，而且这两个网站在搜索结果中显示的说明文字都是dmoz的说明文字（搜索“seo”这个词时）。熟悉的其他几个网站，比如点石，也被dmoz收录，但显示的说明文字不是dmoz的，就没有周期性排名变动的情况。</p>
<p>我一星期前在页面加了<a href="http://www.chinamyhosting.com/seoblog/2006/10/28/se-news-2/">noodp标签</a>，迫使google不要显示dmoz的说明文字，但似乎没有影响。也许是时间不够长。</p>
<p>第三，只是搜“seo”这个词时排名变动，其他词基本没变化。这倒很像针对特定关键词的惩罚，可能是触发了什么filter。但想不出这两个网站有什么共同点会触发相同的filter？</p>
<p>我有印象的SEO网站，似乎只有这两个网站有这种现象。</p>
<p>我曾经想过，我的博客排名变化可能是因为基本停止更新了，以前我停止更新时也排名下降。但seobbs是个论坛，不存在更新问题。</p>
<p>外部链接剧烈变化常常导致排名周期性波动，类似某种考核。但至少我的博客外部链接应该没什么大变化。除非网上什么人在帮我大量制造链接？</p>
<p>继续观察研究。不知大家有什么看法？欢迎见仁见智。</p>
<p>最后补充一句，写这个帖子不是因为“seo”这个词很重要，对这两个站来说，还真没什么大意义。但现象很有意思，想明白了的话，肯定能对google算法多知道一点点。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2009/09/16/seo-seobbs-ranking/">SEO每天一贴和seobbs的Google排名现象</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2009/09/16/seo-seobbs-ranking/feed/</wfw:commentRss>
		<slash:comments>82</slash:comments>
		</item>
		<item>
		<title>关于nofollow的争论</title>
		<link>http://www.chinamyhosting.com/seoblog/2009/07/13/nofollow-debate/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2009/07/13/nofollow-debate/#comments</comments>
		<pubDate>Sun, 12 Jul 2009 22:02:35 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/?p=1038</guid>
		<description><![CDATA[没想到引起一些争论，特此澄清一下。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2009/07/13/nofollow-debate/">关于nofollow的争论</a></p>
]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chinamyhosting.com/seoblog/2009/07/06/seo-and-others/">6号写的帖子</a>里唠唠叨叨写了好几件之间没什么关联的事，其中一句是：</p>
<blockquote><p>利用nofollow控制PR流动已经不管用了，从一年前就不管用了。Matt Cutts前不久在SMX大会上透露了这点。更不妙的是，nofollow会浪费PR和权重。也许以后博客都要关闭评论了。不过先不必轻举妄动。</p></blockquote>
<p>没想到引起一些争论，特此澄清一下。</p>
<p>7号就看到阿里巴巴SEO国平的<a href="http://www.semyj.com/archives/104" target="_blank">这篇博客帖子</a>，以及他在我博客的留言，他认为我误解了Matt Cutts的意思，并误导了其他人。本来也没想回应，因为属于正常的各家之言。9号有朋友告诉我，国平同志<a href="http://www.dunsh.org/forums/thread-55144-1-1.html">在点石论坛也发了帖子</a>，貌似引起了一些争论。为了不至于引起国平所说的误导，我想还是简单回应一下。</p>
<p>首先，我说的是“利用nofollow控制PR流动已经不管用了”，不是nofollow不管用了。nofollow没废止，当然还是起着它原来的作用，那就是告诉搜索引擎这个链接不要follow，这自然会对收录和SEO有影响。对这一点，应该没有不同意见。除非硬要误解我的话。</p>
<p>第二点，也是国平帖子的重点，针对我说的“nofollow会浪费PR和权重”，他认为不对。</p>
<p>引用他博客帖子一段，解释Matt Cutts的话：</p>
<blockquote><p>意思就是说：你原来有一个页面PR值有10点，这个页面中有10个链接。nofollow之前每个链接分到1点的PR值。如果你nofollow掉其中5个链接，你以为剩下的5个链接每个链接能分到2点的PR值，但是实际上，每个链接还是只能分到1点PR值。</p></blockquote>
<p>解释得很正确。Matt Cutts这次透露的主要就是这个意思。建议再读一遍上面这句话。</p>
<p>我的问题是，这句话不就是在说“nofollow会浪费PR和权重”吗？</p>
<p>你有10票可以投出去，如果有10个链接，一个链接一票。现在把5个链接加nofollow，剩下的5个链接并不是各得两票，而是还是得1票，所以一共投出去5票。</p>
<p>那剩下的那5票呢？别忘了，这个页面是有10票的啊。这不就是浪费了5票吗？或者换个说法，那5票，没了，消失了，蒸发了，不见了&#8230; 就我对中文的理解，我觉得说那5票浪费了，完全是一个意思。</p>
<p>换个角度，如果那5个nofollow链接不是nofollow链接，可以有两种情况：</p>
<p>1）那5处就不是链接。那么这10票将投给剩下5个链接，各2票。</p>
<p>2）那5处是普通链接。那么回归正常，10个链接，各得1票。这10票要么增加本站其他页面的PR和权重，进入正向循环，要么增加其他网站页面PR和权重。总之，有10票，投出去10票。</p>
<p>本来有10票，只能投出去5票，另5票消失了，我想来想去还是觉得只能用浪费形容。说实话，我没看懂国平从“nofollow有用”得出“nofollow不会浪费PR和权重”的逻辑是什么。</p>
<p>国平在点石论坛的帖子里也提到：</p>
<blockquote><p>“也许以后博客都要关闭评论了” 也是错的</p></blockquote>
<p>这只是我的一句感慨，没有建议或预言大家关闭评论的意思，谈不上对错。</p>
<p>最后，我的原话最后一句是“不过先不必轻举妄动”，为什么呢？因为我压根不相信nofollow的作用和PR及权重的流动是Google自己所公开说、我们一般理解的那样。</p>
<p>不管怎样，欢迎这种争论，对个人，对读者，对行业都有好处。中文SEO行业就是比较缺少沟通和争论。两年前，大家对写SEO博客比较热衷，现在已经没什么人写了。我自己也从每天一贴变成每月一两贴了。我自己争取明年恢复。</p>
<p>这个星期纵贯线来新加坡演出。我忽然想，MJ和邓丽君、梅艳芳、张国荣可以在另一个世界组个团了，都是英年早逝，都是天王巨星。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2009/07/13/nofollow-debate/">关于nofollow的争论</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2009/07/13/nofollow-debate/feed/</wfw:commentRss>
		<slash:comments>59</slash:comments>
		</item>
		<item>
		<title>Google排名算法异动:大品牌排名全面提升</title>
		<link>http://www.chinamyhosting.com/seoblog/2009/03/02/google-branding/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2009/03/02/google-branding/#comments</comments>
		<pubDate>Sun, 01 Mar 2009 22:22:42 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/?p=878</guid>
		<description><![CDATA[现在Google排名中，很多以前并没出现或排名并不怎么样的大品牌，排名突然提高。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2009/03/02/google-branding/">Google排名算法异动:大品牌排名全面提升</a></p>
]]></description>
			<content:encoded><![CDATA[<p>2月20号，站长世界有一个会员<a href="http://www.webmasterworld.com/google/3854121.htm" target="_blank">发了篇帖子</a>提到，他注意到现在Google排名中，很多以前并没出现或排名并不怎么样的大品牌，排名突然提高。这些大品牌都是500强等级的。他举的例子包括（英文的）“笔记本电脑”，“戒烟”，“高速上网”，“汽车音响”等。这几个词第一页排名中都出现了像戴尔，苹果等大品牌网站。</p>
<p>这个帖子并没引起太多反响。不过值得注意的是，管理员Tedster及多位版主对这个帖子很关注，并且补充了很多想法与细节。</p>
<p>2月25号，著名的Aaron Wall在他的博客发表了一篇帖子，题目就是“<a href="http://www.seobook.com/google-branding" target="_blank">Google新算法给予品牌很大权重</a>”。Aaron Wall在帖子中也举了几个例子，包括机票，汽车保险，靴子，减肥，健康保险，线上学位，手表等几个词。</p>
<p>据Aaron Wall的跟踪记录，这些比较宽泛的行业词前10位中，都在1月18号左右突然出现了很多大品牌公司网站。比如搜索“机票”时，出现的美国航空，达美航空，西北航空，大陆航空等。这些大品牌网站以前排名比较靠后，现在突然同时排进前十。</p>
<p>要说明的是，我在新加坡搜索的结果并不一样。也许是新算法还没扩展到美国之外的其他地方，也许是内地化结果的作用。中文搜索似乎也还没有这个现象。但这个趋势绝对值得注意，早晚会扩展到其他语言和地区。</p>
<p>Aaron Wall的帖子发表之后，这个趋势受到广泛关注和讨论。不过目前还没有来自Google官方的确认。Matt Cutts在<a href="http://sphinn.com/story/103245" target="_blank">Sphinn讨论</a>中承认，最近是有一些算法改变，但这种改变是Google每年都会做的很多次正常修正中的一次，还谈不上是大更新。Matt Cutts拍了一段视频，这几天将会公布出来，让我们拭目以待。</p>
<p>对大品牌给予更多权重，Google CEO Eric Schmidt曾经给过一些暗示。去年10月，Eric Schmidt在一次行业年会中，就在场的新闻记者以及杂志主管们说过，互联网正在变成充斥虚假信息的污水坑，而品牌是判断被信任内容的越来越重要的信号。品牌是解决方法，是解决这个污水坑的方向。</p>
<p>按理说，大品牌，大公司网站确实排名就比小网站容易的多。不过这次算法修正却不同于域名权重提升，而是线下品牌力量在搜索中的反应。</p>
<p>那么现在最大的问号就是，Google怎样判断和鉴别所谓的线下大品牌，从而给予更高排名？</p>
<p>这个问题换一种说法就是，<a href="http://www.chinamyhosting.com/seoblog/">做SEO</a>的能怎样利用这一最新趋势，提高自己网站排名呢？</p>
<p>明天再讨论。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2009/03/02/google-branding/">Google排名算法异动:大品牌排名全面提升</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2009/03/02/google-branding/feed/</wfw:commentRss>
		<slash:comments>27</slash:comments>
		</item>
		<item>
		<title>Google的奇怪规则：URL不能以.0结尾</title>
		<link>http://www.chinamyhosting.com/seoblog/2008/06/16/google-0-file-name/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2008/06/16/google-0-file-name/#comments</comments>
		<pubDate>Sun, 15 Jun 2008 22:09:55 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/?p=571</guid>
		<description><![CDATA[前两天SEOMoz发现和解决了一个很奇怪的Google收录问题。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/06/16/google-0-file-name/">Google的奇怪规则：URL不能以.0结尾</a></p>
]]></description>
			<content:encoded><![CDATA[<p>前两天SEOMoz发现和解决了一个很奇怪的Google收录问题。</p>
<p>SEOMoz有一个网页，是关于他们举办的Web 2.0大奖（Web 2.0 Awards）。URL是：</p>
<p>http://www.seomoz.org/web2.0</p>
<p>这个奖在网上还挺受欢迎，链接很多，URL是PR7。而且一直以来在Google搜索&#8221;Web 2.0 Award&#8221;时都排在第一位。</p>
<p>但前几天SEOMoz发现搜索Web 2.0 Award时，这个页面从Google消失了。排在最前面的是一个更深一层的页面。</p>
<p><img class="alignnone size-full wp-image-576" title="web20-gone" src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2008/06/web20-gone.gif" alt="" width="450" height="259" /></p>
<p>SEOMoz也弄不清是这么回事。所以Rand联系了Google里面认识的人，Google的人建议最好把URL改成不以.0结尾。</p>
<p>注意看SEOMoz这个页面URL，后面没有跟着一个斜线/。在大部分情况下，URL结尾没有典型文件扩展名如.html，.php等时，URL会被当作目录，目录名后面没有斜线时，服务器会在后面自动加上一个斜线。比如<a href="http://www.chinamyhosting.com/seoblog/">SEO每天一贴</a>，如果用户直接打开：</p>
<p>http://www.chinamyhosting.com/seoblog</p>
<p>或者有其他网页链接到上面这个URL，服务器都会自动做一个301转向到：</p>
<p>http://www.chinamyhosting.com/seoblog/</p>
<p>由于某种原因，SEOMoz的这个URL并没有做301转向自动在目录后加上斜线，也就是说URL还是以.0结尾：</p>
<p>http://www.seomoz.org/web2.0</p>
<p>浏览器和蜘蛛就把这个URL当作了文件名，这个文件的扩展名（或者说文件类型）是.0。而.0文件Google拒绝收录，就像.exe文件一样。</p>
<p>SEOMoz做了很多调查，发现页面没被收录问题确实是因为这个以.0结尾的URL。在网上找不到以.0结尾的文件被收录在Google数据库中。像以下这些文件在Google都没收录，但雅虎有收录：</p>
<ul>
<li>en.wikipedia.org/wiki/Windows_1.0</li>
<li>en.wikipedia.org/wiki/Web_2.0</li>
<li>http://en.wikipedia.org/wiki/Die_Hard_4.0</li>
<li>drupal.org/drupal-5.0</li>
<li>keznews.com/3799_Vista_Transformation_Pack_8.0_Final_-_VTP_8.0</li>
<li>en.wikipedia.org/wiki/BASIC_8.0</li>
<li>drupal.org/drupal-6.0</li>
<li>en.opensuse.org/OpenSUSE_11.0</li>
<li>www.shopping.com/xGS-Illustrator_11.0</li>
<li>www.mythtv.org/wiki/index.php/Opensuse_11.0</li>
<li>www.shopping.com/xGS-Suse_9.0</li>
<li>en.wikipedia.org/wiki/Mac_OS_X_10.0</li>
<li><span class="url">en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0</span></li>
</ul>
<p>而非常相似的下面这些URL，Google就有收录：</p>
<ul>
<li>en.wikipedia.org/wiki/Web_2</li>
<li>drupal.org/drupal-5.0-beta1</li>
<li>http://keznews.com/3799_Vista_Transformation_Pack_8_0_Final_-_VTP_8_0</li>
<li>drupal.org/drupal-6.0-beta1</li>
<li>www.mythtv.org/wiki/index.php/Opensuse_10.3</li>
<li>www.mythtv.org/wiki/index.php/Opensuse_10.2</li>
<li><span class="a">en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3</span></li>
</ul>
<p>比较一下这两个URL，域名，链接深度等几乎都没什么区别，唯一的区别就是URL结尾的不同：</p>
<p><span class="a">en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3 收录</span><span class="url"><br />
en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0 没收录</span></p>
<p>SEOMoz发现了这个问题后，<a href="http://www.seomoz.org/blog/unwritten-google-webmaster-guideline-dont-end-urls-in-0" target="_blank">发了一篇帖子</a>。很快Matt Cutts也<a href="http://www.mattcutts.com/blog/dont-end-your-urls-with-exe/" target="_blank">回了篇帖子</a>，做出了回复和调整。Matt Cutts说，是因为连到URL</p>
<p>http://www.seomoz.org/web2.0</p>
<p>的链接足够多时使Google认为它是应该被收录的那个URL版本，但Google又不收录.0文件，所以SEOMoz的这个页面被删除了。</p>
<p>Matt Cutts还提到一个小技巧，要检查某种文件名是否会被Google中被收录，有一个很简单的指令如：</p>
<p>filetype:exe</p>
<p><img class="alignnone size-full wp-image-575" title="exe-index" src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2008/06/exe-index.gif" alt="" width="450" height="382" /></p>
<p>上面的搜索结果可以看到，没有直接以.exe结尾的URL被收录，也就是说.exe文件Google不收录。</p>
<p>同样.0文件Google一直到两天前还都不收录。不过Matt Cutts看到SEOMoz的这个帖子后，与工程师重新审视了一下现在以.0结束的URL，肯定也不都是垃圾页面（可能以前大部分是），所以对Google收录算法做了一定调整，重新开始收录.0文件。其实很多网页以.0结束，并不是因为文件类型，而是像SEOMoz那样，在想写Web2.0时，很巧合的以.0结尾而已。</p>
<p>现在搜索一下的话，已经可以看到SEOMoz的这个Web2.0奖网页已经重新被收录了：</p>
<p><img class="alignnone size-full wp-image-574" title="web20-back" src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2008/06/web20-back.gif" alt="" width="450" height="413" /></p>
<p>第一，这种细节问题，不碰到还真想象不到。</p>
<p>第二，认识人好办事。</p>
<p>第三，Google经常也从善如流。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/06/16/google-0-file-name/">Google的奇怪规则：URL不能以.0结尾</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2008/06/16/google-0-file-name/feed/</wfw:commentRss>
		<slash:comments>41</slash:comments>
		</item>
		<item>
		<title>最权威的Google排名算法解密</title>
		<link>http://www.chinamyhosting.com/seoblog/2008/05/27/google-algorithm-secrets/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2008/05/27/google-algorithm-secrets/#comments</comments>
		<pubDate>Mon, 26 May 2008 22:08:16 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/?p=556</guid>
		<description><![CDATA[说它最权威是因为是Google工程副总裁，负责排名算法的Udi Manber，发表在Google官方博客的一个帖子。下面捡主要内容翻译一下，想看完整原文的请参考Google官方博客Google 搜索质量简介。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/05/27/google-algorithm-secrets/">最权威的Google排名算法解密</a></p>
]]></description>
			<content:encoded><![CDATA[<p>说它最权威是因为是Google工程副总裁，负责排名算法的Udi Manber，发表在Google官方博客的一个帖子。下面捡主要内容翻译一下，想看完整原文的请参考Google官方博客<a href="http://googleblog.blogspot.com/2008/05/introduction-to-google-search-quality.html" target="_blank">Google 搜索质量简介</a>。</p>
<p>搜索质量组是Google内部负责搜索结果排名的。每天Google处理无数查询，Google需要在不到一秒的时间内从数以亿计的网页中选择出应该返回哪些，以及以哪样的顺序显示。</p>
<p>Google对排名算法一直都比较保密，主要原因有两条：竞争及防止被滥用。</p>
<p><a href="http://www.chinamyhosting.com/seoblog/category/google/">Google排名</a>算法的细节是Google皇冠上的珍珠，我们以它为傲，并且非常注意保护。但是完全保密有时候也不是理想状况，所以Udi Manber等人决定与站长多沟通，谈一谈有什么新鲜事，解释一些老的内容，给点建议，参与对话等。这篇帖子是第一篇，以后还会有其他内容。</p>
<p>这个部门的心脏是核心排名小组。排名是相当困难的，比大部分人所想象的更困难。其中一个原因是语言都是模棱两可的，文件也没有任何规则，怎样理解信息没有标准。所以我们需要理解任何人，因为任何原因所写的任何网页。这只是一部分。我们还需要理解用户的查询，再将查询投射到我们所理解的文件上。更不要说不同的人有不同的需求。而且我们需要在几毫秒之内完成这一切。</p>
<p>Google排名算法最出名的部分就是<a href="http://www.chinamyhosting.com/seoblog/2006/04/08/google-pr/">PageRank</a>。PR现在还在使用中，不过已经是一个更大的一系统中的一部分。其他部分还包括语言模块（处理短语，同义词，方言，拼写错误等的能力），查询模块（不仅仅是语言，还包括人们怎样使用语言），时间模块（有的查询返回一个30分钟前刚创作的网页最合适，有的时候返回已经存在很长时间的网页更合适），个性化模块（不是每个人都需要相同的东西）。</p>
<p>另外一个组负责评估我们做的怎样。目标是改善用户体验，这不是主要目标，而是唯一的目标。有每分钟进行的自动评估，阶段性整体质量评估，更重要的还有个别算法调整的评估。当某个工程师有个好主意，开发一个新算法后，我们对这个主意进行测试。一组统计学家会检查数据，确定这个新主意的价值。</p>
<p>2007年，我们做了450次以上的调整，差不多每个星期9次。比如今年1月份，我们对PR算法做了大幅调整。大多数时间我们都是寻找相关性改善的方法，有时我们也致力于简化算法，简单就是好的。（Zac的注释：关于简化算法这句话，是紧接着PR算法调整之后说的，不确认他是讲简化了PR算法，还是说笼统的对算法的简化。我的感觉是PR算法确实有了很大的改变。给我的感觉是，基本上给我们看的工具条PR是不准的，尤其很多该有PR值得内页显示PR为零。也许这就是Udi Manber所说的算法简化造成的。）</p>
<p>在过去两年中，国际搜索是我们的主要焦点之一，包括所有的语言，而不仅限于主要语言。</p>
<p>另外一个小组专门负责新功能和用户界面。Google的用户搜索界面相当简单，当我们增加新功能时，尽量确保对用户来说是简单易用的。在过去一年中，主要的改变包括<a href="http://www.chinamyhosting.com/seoblog/2007/10/10/universal-search/">通用搜索</a>，<a href="http://www.chinamyhosting.com/seoblog/2006/05/17/google-notebook/">Google Notebooks</a>，<a href="http://www.chinamyhosting.com/seoblog/2006/11/07/cse/">自定义搜索引擎</a>以及iGoogle的改进。用户界面小组有一组易用性专家，在辅助研究用户及评估新功能。</p>
<p>还有一个小组专注于反垃圾和其他各种被滥用的技巧，这也就是Matt Cutts所负责的小组。这个组识别新的垃圾技术，并且以可扩展的方式克服这些垃圾。和其他组一样，这个组也是要处理国际多语种。反垃圾组与<a href="http://www.chinamyhosting.com/seoblog/2006/10/19/google-tools/">Google站长工具</a>组紧密配合。</p>
<p>还有其他专门的项目组。整体来说我们的组织结构相当非正式，人员调动频繁，新项目也随时开始。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/05/27/google-algorithm-secrets/">最权威的Google排名算法解密</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2008/05/27/google-algorithm-secrets/feed/</wfw:commentRss>
		<slash:comments>42</slash:comments>
		</item>
		<item>
		<title>Google Sitelinks出现在第61位</title>
		<link>http://www.chinamyhosting.com/seoblog/2008/04/29/google-sitelinks-at-61/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2008/04/29/google-sitelinks-at-61/#comments</comments>
		<pubDate>Mon, 28 Apr 2008 22:08:34 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/?p=529</guid>
		<description><![CDATA[做SEO的都知道Google sitelinks。简单的说，sitelinks是指在Google搜索某些关键词时，除了正常的排名之外，还列出最多8个内页链接。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/04/29/google-sitelinks-at-61/">Google Sitelinks出现在第61位</a></p>
]]></description>
			<content:encoded><![CDATA[<p>做SEO的都知道Google sitelinks。简单的说，sitelinks是指在Google搜索某些关键词时，除了正常的排名之外，还列出最多8个内页链接。比如搜索点石时出现的：</p>
<p><img class="alignnone size-full wp-image-533" title="dunsh-sitelinks" src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2008/04/dunsh-sitelinks.gif" alt="" width="450" height="324" /></p>
<p>关于<a href="http://www.dunsh.org/2006/09/28/google-sitelinks-2/" target="_blank">sitelinks的探讨</a>，已经有不少。一般认为和域名权重，关键词搜索量，网站内部结构等有关。另一个最重要的大家都公认的一个因素就是，sitelinks只出现在排名第一的结果下面。</p>
<p>这个特征也被颠覆了。前两天有人发现，sitelinks也可能出现在排名第61的结果下，如下图所示:</p>
<p><img class="alignnone size-full wp-image-535" title="sitelinks-61" src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2008/04/sitelinks-61.gif" alt="" width="358" height="272" /></p>
<p>我试了几次都没有看到这个结果。不过<a href="http://groups.google.com/group/Google_Webmaster_Help-Indexing/browse_thread/thread/9321b20e3d35d6df/" target="_blank">在Google Groups的一个帖子</a>里，一个站长提出这种情况后，Google员工 JohnMu回复说，可以参考Google负60惩罚，也就是我前些天提到的<a href="http://www.chinamyhosting.com/seoblog/2008/03/05/panalty-case-study/">这个被惩罚的网站情况</a>。</p>
<p>这个回复颇引入遐想。</p>
<p>首先确认sitelinks出现在第61位是可能的。那位站长并没说瞎话，抓图也不是photoshop做出来的。</p>
<p>第二，Google负60惩罚也是确定存在的，而且不是个别现象，是对某一类涉嫌黑帽网站的正常处理方式。估计以前讨论的<a href="http://www.chinamyhosting.com/seoblog/2006/10/23/minus-30-penalty/">负30</a>，<a href="http://www.chinamyhosting.com/seoblog/2008/01/31/position-6-penalty/">负6</a>等也都是真实存在的。Google的各种惩罚和过滤算法，已经多得快让人记不住了。</p>
<p>JohnMu的回复还暗示，被给予负60惩罚的网站，其实还是有不错的权重，所以才会带有sitelinks。只不过由于某些被怀疑的手法，使得Google算法或<a href="http://www.chinamyhosting.com/seoblog/2008/03/18/google-rater-guidelines/">人工审查人员</a>认为，这个网站不适合排在第一位，得放到第61，却保留了sitelinks。</p>
<p>也有人认为这种惩罚有可能是人工进行的。</p>
<p>具体情况外人很难确切知道。不过能感觉得到Google算法日益复杂，考虑的因素非常多。做SEO的想<a href="http://www.chinamyhosting.com/seoblog/2008/03/14/stats-test/">从现象逆向工程</a>知道本质，越来越不可能了。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/04/29/google-sitelinks-at-61/">Google Sitelinks出现在第61位</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2008/04/29/google-sitelinks-at-61/feed/</wfw:commentRss>
		<slash:comments>42</slash:comments>
		</item>
		<item>
		<title>Google工具条PR更新与排名变化的迷思</title>
		<link>http://www.chinamyhosting.com/seoblog/2008/03/03/pr-update-feb/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2008/03/03/pr-update-feb/#comments</comments>
		<pubDate>Sun, 02 Mar 2008 22:19:33 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/2008/03/03/pr-update-feb/</guid>
		<description><![CDATA[看到网上有一些关于PR更新及网页在Google中排名变化的一些迷思，觉得还是有必要把自己的一些理解跟大家介绍一下。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/03/03/pr-update-feb/">Google工具条PR更新与排名变化的迷思</a></p>
]]></description>
			<content:encoded><![CDATA[<p>这几天Google工具条PR又在更新了。我感觉更新还没结束，显示PR数据准确性很值得怀疑。</p>
<p>现在对<a href="http://www.chinamyhosting.com/seoblog/2006/04/08/google-pr/">Google PR</a>更新本身越来越不感兴趣了。因为基本上没有大的造链接活动，PR值也不会有什么太大变化了。不过看到网上有一些关于PR更新及网页在Google中排名变化的一些迷思，觉得还是有必要把自己的一些理解跟大家介绍一下。</p>
<p><strong>Google工具条PR不是真实的PR</strong></p>
<p>大家所看到的工具条上显示的绿色条，更准确的应该称为可见的工具条PR值，而不是Google内部用于排名计算的真实PR值。</p>
<p>Google真正使用的PR值是连续不停的计算的，并不是每三个月或两个月改变一次。我们看到的工具条PR是一段时间以前（比如两个月或三个月）某一个时间点的PR值输出。所以我们现在看到的工具条PR值，已经是两三个月前的数据。现在真实的PR值是多少是无法知道的。</p>
<p>另外，工具条上显示的PR值是否是输出时真实的PR值，我也表示怀疑。不仅是这次更新，从很多次更新的情况看，要么Google有意不告诉我们真实PR值，要么很多网站的数据出现了错误。</p>
<p><strong>Google工具条PR更新与排名变化没有时间对应关系</strong></p>
<p>在论坛里看到不少人说，Google PR值更新，网站PR提高了一或二，怪不得这几天排名也上升了。</p>
<p>其实Google工具条PR更新与<a href="http://www.chinamyhosting.com/seoblog/category/google/">Google排名</a>之间没有时间上的对应关系。像上面说的，真实的PR是连续不停计算的，而且是随时被计入排名算法的。更新后我们看到的工具条PR值所带来的效应在几个月前就已经被计入排名了。</p>
<p>所以不要从工具条PR值上升，来判断对网页排名有什么影响。如果你同时看到工具条PR值上升和排名上升，最好找其他原因，这是时间上的巧合，而并没有直接因果关系。</p>
<p><strong>Google PR只与链接有关</strong></p>
<p>经常看到博客留言或论坛中有人说，我的网站已经两年了，为什么PR还是零呢？或者，我的网站内容全是原创，为什么PR还是零呢？</p>
<p>原因是，PR值与站长是否认真，内容是否原创，网站设计怎么样，甚至与域名年龄，都没有直接关系。</p>
<p>PR的计算只是根据反向链接，进来的链接越多，这些链接页本身的投票力越高，你的网页PR值就越高。所以就算你的域名已经十年了，如果没有反向链接，PR值也高不了。</p>
<p>最近几个月有可能出现一些看似的例外。有的网站因为<a href="http://www.chinamyhosting.com/seoblog/2007/10/17/paid-links/">付费链接</a>问题被惩罚，PR值要么下降，要么清零。目前不知道这些网站PR值变化是人工调整，还是因为算法检测出付费链接后取消某些链接的投票力，而造成与之相关的其他网站PR值变化。总之，还是与链接有关。</p>
<p><strong>Google已经不跳舞很久了</strong></p>
<p>在论坛里还会看到有人用Google dance这个词，有的专家到现在也还在说Google dance。</p>
<p>其实Google已经不dance很久了。</p>
<p>Google dance这个词是数年前形容Google每个月一次大更新而创出来的词。那时候的Google更新，是网页数据库，算法，各数据中心之间的同步全部发生彻底变化。Google已经不进行这种dance四年多了。</p>
<p>现在的排名变化更多的是因为<a href="http://www.chinamyhosting.com/seoblog/2006/08/04/google-terminology/">算法更新</a>或<a href="http://www.chinamyhosting.com/seoblog/2006/08/04/google-terminology/">数据刷新</a>而引起的。而且算法更新现在的特点是小规模不停的调整（everflux），那种大规模的更新已经十分十分少见。</p>
<p>以前的真正的Google dance和现在的排名变化特征并不相同。所以用Google dance这个词对某些SEO初学者来说可能有误导。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/03/03/pr-update-feb/">Google工具条PR更新与排名变化的迷思</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2008/03/03/pr-update-feb/feed/</wfw:commentRss>
		<slash:comments>41</slash:comments>
		</item>
		<item>
		<title>利用Google算法漏洞24小时狂扫30万流量</title>
		<link>http://www.chinamyhosting.com/seoblog/2008/01/08/jan-1-google/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2008/01/08/jan-1-google/#comments</comments>
		<pubDate>Mon, 07 Jan 2008 22:11:02 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/2008/01/08/jan-1-google/</guid>
		<description><![CDATA[Google排名算法算是考虑比较全面的，但一样会有这样那样的漏洞，比如Google对新网页的处理。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/01/08/jan-1-google/">利用Google算法漏洞24小时狂扫30万流量</a></p>
]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chinamyhosting.com/seoblog/category/google/">Google排名算法</a>算是考虑比较全面的，但一样会有这样那样的漏洞，比如Google对新网页的处理。</p>
<p>按正常算法，通常新的网页比较难取得好的排名，因为没有历史，没有<a href="http://www.chinamyhosting.com/seoblog/2006/05/22/linkbaiting/">反向链接</a>。很多人观察到Google会给新的网页一些特殊权重，使得这些新创建的页面有机会排到前面。</p>
<p>另外，Google检测到某个关键词突然被大量搜索时，能够意识到这个关键词大概是当前的热门新闻。当检测到这种突发性的新闻关键词时，相关的新网页就给予更多权重，以使用户能够看到最新的相关内容。</p>
<p>在正常情况下，这两个特点当然给用户带来更好的体验，可有的时候也会成为被利用的漏洞。这一点在2008年1月1号显露无遗。</p>
<p>1月1号Google为了纪念TCP/IP协议诞生25周年，做了一个特殊的doodle。当用户点击Google首页logo时，会被直接带到搜索“January 1 tcp/ip”的搜索结果页。幻灭有<a href="http://www.gseeker.com/50226711/google_2008doodleecc_133579.php" target="_blank">抓图和报道</a>。</p>
<p>一位叫Ryan Durk的能人立刻抓住这个机会，在24小时内从Google狂扫30万IP。</p>
<p>Ryan Durk就是利用Google给予新网页的特殊权重。他观察到在搜索January 1 tcp/ip时，当时排在前面的有维基百科的一个网页，和一些其他显然权重不高的网页。Ryan Durk选择Google自己的博客服务blogspot.com，专门为January 1 tcp/ip做了一个博客，博客URL是http://january-1-tcp-ip.blogspot.com</p>
<p>选择blogspot的原因是blogspot本身域名权重极高，博客可以通过ping得到一些链接，blogspot能扛得住巨大流量，而且允许放Adsense。</p>
<p>Ryan Durk注册了这个博客后，去一些社会性网摘书签网站提交，然后最聪明的是通过digg网站做了特殊推广。Ryan Durk的目标不是把自己的blogspot网页排到第一，而是把他提交的digg页排到最前面。Digg页排到前5名，就能够吸引大量digg用户继续投票，而且能在digg社区引起关注，带来内部链接。</p>
<p>结果正如Ryan Durk所预料的，在3小时之内这个digg页进入digg首页，Google排名进第三。后续效应就由digg用户们自己继续扩展了，不必Ryan Durk进行推动。很快他的这个digg页被挖了2000多次，Google排名升到第一。</p>
<p>通过Google logo来到这个digg页的人也都会想看看，为什么Google会以某种形式背书了Ryan Durk的blogspot博客，所以也就很自然的点击到他的博客。他新建的博客页很快也排在了第二。</p>
<p><img src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2008/01/jan-1-tcpip.gif" alt="jan-1-tcpip.gif" /></p>
<p>这件事<a href="http://googlesystem.blogspot.com/2008/01/google-artificially-promotes-recent-web.html" target="_blank">被Google Operating System报道</a>后，很快就产生了大量的抄袭者，引起很多SEO的关注。</p>
<p>SEOBook的Aaron Wall不愧是SEO行业的思考者，触觉非常敏感，很快联系到Ryan Durk，写了一下<a href="http://www.seobook.com/guest-post-super-digg-gaining-300k-hits-google-24-hours-january-1-tcp-ip" target="_blank">整个过程</a>，作为客座文章发在SEOBook博客上。</p>
<p>据Ryan Durk自己的文章介绍，在24小时内他的博客来了30万独立IP，Adsense的点击率是0.5%。这个点击率应该算是很低的，但是鉴于流量很高，相信他也赚了一小笔，而且没有成本。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2008/01/08/jan-1-google/">利用Google算法漏洞24小时狂扫30万流量</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2008/01/08/jan-1-google/feed/</wfw:commentRss>
		<slash:comments>56</slash:comments>
		</item>
		<item>
		<title>Google处理子域名时可能的重大改变</title>
		<link>http://www.chinamyhosting.com/seoblog/2007/12/10/subdomain-google/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2007/12/10/subdomain-google/#comments</comments>
		<pubDate>Sun, 09 Dec 2007 22:12:52 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/2007/12/10/subdomain-google/</guid>
		<description><![CDATA[Google将很快在对待子域名时与对待子目录一样。也就是说，一个域名下最多只有两个URL可以被列在特定搜索结果中，不会再出现三个四个或更多子域名与主域名URL同时排在搜索结果中。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2007/12/10/subdomain-google/">Google处理子域名时可能的重大改变</a></p>
]]></description>
			<content:encoded><![CDATA[<p>11月20号，有人在站长世界论坛问<a href="http://www.webmasterworld.com/google/3509806.htm" target="_blank">Google处理子域名和二级目录时的区别</a>。版主tedster做了比较详细的回答。</p>
<p>从大部分角度来说，子域名是被当作一个独立的域名来处理的。有的时候子域名带有点主域名的特性，比如说在<a href="http://www.dunsh.org/2006/09/28/google-sitelinks-2/" target="_blank">sitelink</a>里，子域名可能和主域名同时列出来。</p>
<p>子域名被惩罚或丧失权重，一般不会影响到主域名。但反过来并不成立，也就是说如果主域名被惩罚，通常会连带子域名受影响。</p>
<p>从总体上说，在一个权重很高的域名上建立子域名，这个子域名和新的域名相差不多，权重必须靠自己重新建立。</p>
<p>这些内容与<a href="http://www.chinamyhosting.com/seoblog/2006/08/10/subdomain-or-directory/">我们目前所知</a>的大致相同，所以也就没有特意介绍。</p>
<p>不过12月7号，tedster在参加拉斯维加斯Pubcon（站长世界组织的站长大会）时，Matt Cutts告诉他，Google将很快在对待子域名时与对待子目录一样。也就是说，一个域名下最多只有两个URL可以被列在特定搜索结果中，不会再出现三个四个或更多子域名与主域名URL同时排在搜索结果中。</p>
<p>这种现象挺常见，有很多人在权重较高的域名开多个子域名，试图控制搜索排名。不少大站常这么做。</p>
<p>8号tedster又加了一句，说Matt Cutts下午把他叫到一边澄清了一下，这个改变并不是百分之百子域名的URL不可能和主域名同时出现。Google目前的计划是，使用一个阻尼参数，使得同一个域名下第三个URL被显示很困难，第四个就更困难。Matt Cutts可能还会在其他场合谈这个问题。</p>
<p>当然这种处理肯定是有例外的。比如像博客托管商，不同的子域名是不同的博客作者，不太可能完全这样处理。</p>
<p>我感觉，如果Google真的这么做，会对很多网站的<a href="http://www.chinamyhosting.com/seoblog/">SEO策略和技巧</a>产生重大影响。让我们拭目以待吧。</p>
<p>更新：Matt Cutts<a href="http://www.mattcutts.com/blog/subdomains-and-subdirectories/" target="_blank">刚发了篇博客</a>，这个算法已经使用好几个星期了。谁也没发现。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2007/12/10/subdomain-google/">Google处理子域名时可能的重大改变</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2007/12/10/subdomain-google/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>补充材料再思考</title>
		<link>http://www.chinamyhosting.com/seoblog/2007/11/15/supplemental-result-4/</link>
		<comments>http://www.chinamyhosting.com/seoblog/2007/11/15/supplemental-result-4/#comments</comments>
		<pubDate>Wed, 14 Nov 2007 22:29:29 +0000</pubDate>
		<dc:creator>Zac</dc:creator>
				<category><![CDATA[Google排名技术研究]]></category>

		<guid isPermaLink="false">http://www.chinamyhosting.com/seoblog/2007/11/15/supplemental-result-4/</guid>
		<description><![CDATA[自从Google取消补充材料标记后，关于补充材料的讨论沉积下来了。Google只是取消了在搜索结果中标注补充材料，补充材料以及补充索引还是存在的，只不过我们不能直接看出来了。<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2007/11/15/supplemental-result-4/">补充材料再思考</a></p>
]]></description>
			<content:encoded><![CDATA[<p>自从<a href="http://googlechinablog.com/2007/08/blog-post_01.html" target="_blank">Google取消补充材料标记</a>后，<a href="http://www.chinamyhosting.com/seoblog/2006/05/15/supplemental-result/">关于补充材料</a>的讨论沉寂下来了。Google只是取消了在搜索结果中标注补充材料，补充材料以及补充索引还是存在的，只不过我们不能直接看出来了。</p>
<p>在经过一段时间的思考后，今天谈谈对补充材料的更进一步认识。</p>
<p>以前我曾经觉得补充材料和补充索引的引入，很有可能是因为想节省带宽。但Google最近表明，补充索引中的网页抓取和更新频率加快，补充索引中的网页出现在搜索结果中的机会也提高，说明不是为了节省带宽。</p>
<p>结合一些其他方面的观察，我现在觉得补充索引是为了提高搜索速度。在搜索某些关键词时，Google可能只搜索主索引，忽略补充索引里的结果，这样能大大提高速度。搜索所有关键词都在抓取的所有页面索引中寻找结果的话，那计算量必然使返回结果的速度减慢。</p>
<p>挑出一部分权重高的网页进入主索引，把其他权重低的归入补充索引，可以大大提高计算速度。有的时候主索引中结果不足，才去补充索引中寻找结果。至于在什么情况下才会触发去补充索引中寻找网页不得而知。</p>
<p>以前补充材料被关注的时候，就有朋友认为补充材料并不可怕，因为不少关键词搜索结果中，列在前面的也包含很多补充材料。我想这种观察是错误的。</p>
<p>举一个例子。现在无法准确判断哪些页面是在补充索引中，所以我拿以前谈补充材料时<a href="http://www.dunsh.org/2007/07/31/supplemental-new/" target="_blank">一个帖子</a>的抓图来看点石论坛的一个页面。</p>
<p><img src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/dunsh-2.gif" alt="dunsh-2.gif" /></p>
<p>这个页面</p>
<p><a href="http://www.dunsh.org/forums/thread-6462-1-1.html" target="_blank"> http://www.dunsh.org/forums/thread-6462-1-1.html</a></p>
<p>当时是在补充索引中的，我判断现在也还在补充索引中。</p>
<p>首先这个网页肯定存在于Google的索引库中，我们可以从Google快照中证实这一点。</p>
<p><a href="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-cache.gif" title="6462-cache.gif"><img src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-cache.thumbnail.gif" alt="6462-cache.gif" /></a></p>
<p>如果我们在点石域名内搜索网页标题+发帖人史安牛的名字，可以发现Google返回结果中包含这个网页，排在第二位。</p>
<p><a href="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-1.gif" title="6462-search-1.gif"><img src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-1.thumbnail.gif" alt="6462-search-1.gif" /></a></p>
<p>但是如果我们搜索帖子中的第一句话+史安牛，Google显示没有相匹配的文件。</p>
<p><a href="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-2.gif" title="6462-search-2.gif"><img src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-2.thumbnail.gif" alt="6462-search-2.gif" /></a></p>
<p>要注意，实际上在Google数据库中，确实存在相匹配的文件，从上面的快照和搜索中可以看出。</p>
<p>如果我们不限定在点石的网站内搜索帖子的第一句话+史安牛，也可以看到这个页面不被返回。</p>
<p><a href="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-3.gif" title="6462-search-3.gif"><img src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-3.thumbnail.gif" alt="6462-search-3.gif" /></a></p>
<p>但是如果我们搜索帖子中的第二段的一句话+史安牛，又会发现这个网页可以被返回。</p>
<p><a href="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-4.gif" title="6462-search-4.gif"><img src="http://www.chinamyhosting.com/seoblog/wp-content/uploads/2007/11/6462-search-4.thumbnail.gif" alt="6462-search-4.gif" /></a></p>
<p>结论是Google确实有两个索引，主索引和补充索引。在补充索引中的网页有时候在某些关键词下，根本不参与排名。就算已经被收录，网页中有这个关键词，而且没有其他匹配文件的时候，这个网页因为是存在于补充索引中，所以根本不会被返回。</p>
<p>HighDiy有一篇关于<a href="http://seo.highdiy.com/index.php/seo/detect-supplemental-results/" target="_blank">检查补充索引替代方法</a>的帖子，很全面深入，但其中一句话恐怕不太正确。他提到“Google给出网页进入补充索引的原因包括网页“not fully indexed”，那么，反过来，如果发现某个网页的缓存并不完整，即不包涵网页的全部内容，那么，也基本上可以判定该页位于补充索引了。”我觉得这里的not fully indexed指的不是缓存不包含全部网页内容（没见过这样的缓存），而是指网页虽然被完整收录，但并不参与排名。</p>
<p>所以大量网页进入补充索引，在很大程度上说明了<a href="http://www.chinamyhosting.com/seoblog/2006/10/24/site-checkup/">网站的健康情况</a>。补充索引中的网页，能排到前面的几率还是大大降低。</p>
<p>根据Google的说法，进入补充索引最大的原因是PR值过低。顺便做个实验，我这个帖子有链接到点石的那个网页，过一段时间看看是不是还在补充索引中。按Google的说法，有了外部链接，应该从补充索引中出来。</p>
<p><a href="http://www.chinamyhosting.com/">中新网络科技</a>版权所有。
转载时必须以链接形式注明原始出处及本声明。<br>
原载：<a href="http://www.chinamyhosting.com/seoblog/">Zac@SEO每天一贴</a><br/><br/><a href="http://www.chinamyhosting.com/seoblog/2007/11/15/supplemental-result-4/">补充材料再思考</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.chinamyhosting.com/seoblog/2007/11/15/supplemental-result-4/feed/</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
	</channel>
</rss>
