订阅Feed
RSS
评论RSS

说它最权威是因为是Google工程副总裁,负责排名算法的Udi Manber,发表在Google官方博客的一个帖子。下面捡主要内容翻译一下,想看完整原文的请参考Google官方博客Google 搜索质量简介

搜索质量组是Google内部负责搜索结果排名的。每天Google处理无数查询,Google需要在不到一秒的时间内从数以亿计的网页中选择出应该返回哪些,以及以哪样的顺序显示。

Google对排名算法一直都比较保密,主要原因有两条:竞争及防止被滥用。

Google排名算法的细节是Google皇冠上的珍珠,我们以它为傲,并且非常注意保护。但是完全保密有时候也不是理想状况,所以Udi Manber等人决定与站长多沟通,谈一谈有什么新鲜事,解释一些老的内容,给点建议,参与对话等。这篇帖子是第一篇,以后还会有其他内容。

这个部门的心脏是核心排名小组。排名是相当困难的,比大部分人所想象的更困难。其中一个原因是语言都是模棱两可的,文件也没有任何规则,怎样理解信息没有标准。所以我们需要理解任何人,因为任何原因所写的任何网页。这只是一部分。我们还需要理解用户的查询,再将查询投射到我们所理解的文件上。更不要说不同的人有不同的需求。而且我们需要在几毫秒之内完成这一切。

Google排名算法最出名的部分就是PageRank。PR现在还在使用中,不过已经是一个更大的一系统中的一部分。其他部分还包括语言模块(处理短语,同义词,方言,拼写错误等的能力),查询模块(不仅仅是语言,还包括人们怎样使用语言),时间模块(有的查询返回一个30分钟前刚创作的网页最合适,有的时候返回已经存在很长时间的网页更合适),个性化模块(不是每个人都需要相同的东西)。

另外一个组负责评估我们做的怎样。目标是改善用户体验,这不是主要目标,而是唯一的目标。有每分钟进行的自动评估,阶段性整体质量评估,更重要的还有个别算法调整的评估。当某个工程师有个好主意,开发一个新算法后,我们对这个主意进行测试。一组统计学家会检查数据,确定这个新主意的价值。

2007年,我们做了450次以上的调整,差不多每个星期9次。比如今年1月份,我们对PR算法做了大幅调整。大多数时间我们都是寻找相关性改善的方法,有时我们也致力于简化算法,简单就是好的。(Zac的注释:关于简化算法这句话,是紧接着PR算法调整之后说的,不确认他是讲简化了PR算法,还是说笼统的对算法的简化。我的感觉是PR算法确实有了很大的改变。给我的感觉是,基本上给我们看的工具条PR是不准的,尤其很多该有PR值得内页显示PR为零。也许这就是Udi Manber所说的算法简化造成的。)

在过去两年中,国际搜索是我们的主要焦点之一,包括所有的语言,而不仅限于主要语言。

另外一个小组专门负责新功能和用户界面。Google的用户搜索界面相当简单,当我们增加新功能时,尽量确保对用户来说是简单易用的。在过去一年中,主要的改变包括通用搜索Google Notebooks自定义搜索引擎以及iGoogle的改进。用户界面小组有一组易用性专家,在辅助研究用户及评估新功能。

还有一个小组专注于反垃圾和其他各种被滥用的技巧,这也就是Matt Cutts所负责的小组。这个组识别新的垃圾技术,并且以可扩展的方式克服这些垃圾。和其他组一样,这个组也是要处理国际多语种。反垃圾组与Google站长工具组紧密配合。

还有其他专门的项目组。整体来说我们的组织结构相当非正式,人员调动频繁,新项目也随时开始。

作者: Zac@SEO每天一贴
原载: 中新国外服务器
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

收藏本页到:
365Key | del.icio.us | | 添加到雅虎收藏+


41 条评论 “最权威的Google排名算法解密”

  1. tent says:

    这篇帖子是07年的吧?

  2. 土匪 says:

    其实各家的排名算法大同小异,只是不同的搜索的不同因素比重有所不同而已

  3. David says:

    感觉是泛泛的说了排名考虑的主要因素

  4. winbo says:

    不好意思。上面那个连接是。印书的。我把你的作品印了一本自己好好看。。
    有需要你也去看看。

  5. dnf says:

    我也感觉说的很泛。 对实际的站长 个人感觉帮助不大。

  6. 杏仁 says:

    TO:winbo 你肯定是新来的,Zac即将要出书了,网络运营方面,你就别再想了!顺便问一下Zac,书大概什么时候出版?

  7. dupola says:

    一般出书,出版社都会给作者一些,另外购买的价格也会相当便宜。

    我预订一本赠书。。。。。。哈哈。

  8. 起点 says:

    我有个问题急着想问下你们哦:
    我们网站是.aspx的动态网页,(商务网站) 现在在实现伪静态页。
    我想问下,把参数给去掉,但是后缀名还是.aspx, 这个和.html相比,是不是也不容易被搜索引擎抓取呀?
    那么生成.aspx和.html这样的伪静态页 各优缺点是什么呢?
    (听说生成.html不好维护,但是它速度快……)

  9. ZCQ says:

    我也觉得这个解密没有什么实质性的技术描述。我想借此发条广告,我们需要SEO合作人,条件优厚!有兴趣的可以直接给我写邮件CEO@GPVIN.CN

  10. Ring says:

    为啥我觉得好像ZAC以前发过这篇文章?…..

  11. footprinter says:

    感觉他什么都没说。

  12. 平野星原 says:

    当“个性化模块”很成熟的时候,恐怕很多提供服务或者电子商务网站,会无法在某个关键词的搜索结果都排在前列,因为每个人的需求和兴趣都不同。不过那得每个人都有google账户,并使用很长一段时间才可以实现吧…

  13. pollux says:

    哎 我同时订阅了 点石和zac的博客

    今天发现 2者 都只更新了 这一篇文章!

  14. 之前看了英文原帖,基本上没什么实质内容。

  15. 小风 says:

    沒太看明白…

  16. Estyle says:

    我也没看出来有啥实质的内容,或许是理解力不够。
    比较期待后续的内容……

  17. 创业中国 says:

    google的算法在优化,作为站长也要进步。一切算法调整的最终目的就是给查询者他所需要的,站长只要给目标群体他所需要的,再加以适当的seo优化,在搜索引擎中有好的表现应该也是水到渠成的吧!

  18. SEO says:

    也算不上什么解密咯

  19. 菜鸟SEO says:

    都是官方说辞,
    很难琢磨哦

  20. dj says:

    以前好像在那看到过.

  21. 什么时候多谈baidu,我们好多流量都来自百度!

  22. adUSD.com says:

    已经转到到我的小站, 包括原始链接与作者,

  23. lonmen says:

    这几天又受余震的影响,没有时候和心情看你的文章,现在来补上!
    到现在认真的了你的30篇左右的文章了,总是觉得如果能做成一本书最好。
    有没有考虑过呢??

  24. 二十一 says:

    发现google给词排名的速度没百度反应快,MSN似乎更快。百度GOOGLE有个类似地方:每30左右为一个层次。
    当一个词排到第六、七页的时候 下次跳跃可能就是3、4页上,再进2、1页。
    而且,百度反应迟钝,每天一次,google同一天会变化几次。
    请指正^_^

  25. go2act says:

    嗯。
    有时间去看看这篇文章。

  26. 我其实也很想知道ZAC前辈什么时间出书呢

  27. guest says:

    基本上是通篇空话,有标题党嫌疑。

  28. 办公用品 says:

    可能是个人理解力问题,没看明白是什么技术

  29. 方眼网 says:

    这个说了和没说一个样`

  30. 我的网站反向链接很多,用LINK:www.chinafolk.com.cn 在google系统查就只有1个是怎么回事?

  31. Zac says:

    winbo, 杏仁, dupola, 网站竞争力: 书可能年底会出版。dupola,来新加坡吧,送本签名的给你。 :-)

    起点: .aspx和.html对搜索引擎完全没区别。

    Ring, dj : 以前没发过,人家刚讲话,我以前怎么发啊。不过可能看着似曾相识,因为也没什么新东西…

    剪纸网: Google并不显示所有知道的链接。

  32. 集装袋 says:

    这文章也没有讲多少实质的内容,相比更期待ZAC的新书。

  33. hewei says:

    期待您的新书出现,哈哈

  34. 周易 says:

    这文章也没有讲多少实质的内容,相比更期待ZAC的新书。

  35. health says:

    感觉最近google的排名进行了大量的调整, 且还在更新中

  36. xbf says:

    不错,学到东西了。如果我要优化这个站:http://www.52shehua.cn 怎么来做呢?

  37. 杨为青 says:

    没有最权威的,除非你有关系

  38. Tom says:

    这东东是比较泛,不过可以理解:竞争及防止被滥用

发表评论