当梦想照进现实

Google 段落排名算法(Passage Ranking)全解读

2021.03.03

去年 10 月,Google 透露了几个基于 AI 的新功能,其中包含了段落排名。2021 年 2 月,段落排名算法开始在美国正式上线了。
我认为这是影响深远一个排序算法,因为很多信息型搜索和内容站的排名将受到影响,而且长期来看将对内容生态产生影响。

什么是 Google 段落排名算法(Passage Ranking)


以上是 Google 原文中的排名算法的示例图
对于具体的搜索词,Google 会返回跟搜索词主题最相关的网页,而有一些大而全的网页虽然包含相关的内容,但因为太全面,整个网页的主题宽泛,反而获取不到排名。

Google 段落排名算法,就是对于这批大而全的网页,只要部分段落内容是跟搜索词匹配,网页的排名会有额外的提升。也即是在排名时,颗粒度将细化到段落。

Google 工程师 Martin Splitt 举了个例子:
Google 会识别出每个网页的主题,比如网页 A 是土豆主题,网页 B 是番茄主题。还有个非常丰富的网页 C,包含了土豆和番茄的内容。这个被判断为蔬菜主题。
在搜索排序时,Google 会找到一批主题跟 Query 匹配的网页。比如当用户搜索土豆时,就返回了土豆主题的网页。
因为 Google 无法理解土豆和蔬菜的关联关系,所以并没有出现蔬菜的排名(即便包含土豆的内容),只会出现土豆的排名。
而通过段落算法,Google能识别出这个网页是蔬菜主题,但其中一部分是讲土豆的。因此会把这部分段落内容拿出来,参与到土豆的排名中。
我花了个简单的图:

2021/2/11 Google 段落排名算法已上线

Google 在 Twitter 宣布:段落排名算法已经于 2021/2/11 在美国+英语范围内上线,后续将在英语的其他地区、其他语言和地区上线。

注:后续上线情况将在博客和公众号保持更新。

段落排名算法的预计影响


上图是 Sensor 的排名监控情况,能看出段落算法上线时排名有明显变化
Google 称,整体上段落排名算法会对 7% 的搜索产生影响。更具体的影响有以下几个方面:

  • 内容型网站将受到影响。段落排名算法主要针对内容,所以一些内容型网站将受到明显影响。比如一个较短的文章之前在某个特定关键词有排名,现在前面忽然插入了一个长文网页的排名
  • 电商网站影响较小。因为电商网站的文本内容较少,段落排名算法无法生效,尤其是产品列表页。产品详情页可能会有一些影响。
  • 长网页有明显利好。长网页会有明显的排名和流量的提升。因为算法就是针对那些有相关内容,但篇幅较长的内容
  • 信息型搜索影响明显。因为信息型搜索一般都是内容型网站的结果
  • 长期来讲,对内容生态有帮助。一方面对 SEO 编辑来讲,日常会针对搜索词来组织内容,有些内容一篇就能写完的,为了命中搜索词非要拆开,算法上线后就不需要拆开了;另一方面还有一批不太会 SEO,但有专业能力的写作者,在算法上线前因为 Query 命中的问题没有获得应有的流量,算法上线后也会明显受益。通过这两方面,Google 在引导站长和写作者更专注于内容质量。

Google 段落排名算法是按照段落索引?


上图是搜索引擎的简单模型,本次段落算法主要影响索引检索器这个部分,不影响索引构建部分
有人会问,Google是否将网页打散为段落,改为段落去索引,然后去排名。
Google 的回应是,并没有对段落单独索引,仍是以网页维度索引和排名。不过段落内容会作为附加的排名因素
也就是说,Google 主要是做加法,在之前索引和排序的基础上,如果有个网页的段落内容命中了 query,在排名上会有提升。

针对段落排名算法,SEO 需要做什么

Google 的建议仍是不需要做什么针对性的改动。只是 Google 可以更好的理解网页的内容,并且可以针对网页的不同部分内容进行打分。
我的建议也是,对于 SEO 编辑来讲,以后可以更专注于内容的生产,不用刻意的对内容进行分割

怎么才能主动命中段落算法呢?比如文本内容多长才是段落?
Martin Splitt 说这个算法依赖算法和机器学习,所以一直在调整,并没有固定的长度,可能是几个词,也可能是一句话。

另外,能否退出这个段落算法?
答案是否定的。这个排名是搜索结果中的自然排名,并不是插入的排名(Martin Splitt 的原话是,这个是 SERP 的蓝色链接),所以无法退出

参考文档

  • 《How AI is powering a more helpful Google》https://blog.google/products/search/search-on/
  • Google 在 Twitter 上宣布算法上线 https://twitter.com/searchliaison/status/1318609604029263872
  • 《What Is Google Passage Ranking: 16 Key Points You Should Know》Martin Splitt 解答 段落算法的问题 https://www.searchenginejournal.com/google-passage-ranking-martin-splitt/388206/
  • 搜索引擎简单模型图转自《自制简单搜索引擎》http://fuzhii.com/2016/01/08/develop-search-engine/
Comments
Write a Comment
  • 无奈的seo站长 reply

    谷歌还在更新对整个生态更有益的算法,确实在做更开放更利用内容发展的事情;

    百度呢,熊掌号、MIP说下线就下线,现在折腾封闭的小程序,连竞价都要搞全行业托管。它只做对财报有利的事。唉,其他几家搜索友商也是太不给力,百度这么作都干不过。

    搜索技术这么难开发的嘛?!