当梦想照进现实

2018 Google Product Experts Summit 干货整理

2018.11.06

Google Product Experts Summit

今年再次有幸参加 Google 举办的 Product Experts Summit

先介绍下这个 summit,这是 Google 专门面向官方论坛版主的活动,有 webmaster, youtube, chrome, gmail 等产品参与。我是 webmaster 中文论坛的版主,所以参与了这次的活动。
这次是在旧金山举办,来回 40+ 个小时,真心辛苦。不过也有一些干货,在此整理,方便大家。

先说下一年的重点

Google Event Center

上图为本次会议的地点:Google Event Center,也就是 Google Cloud 的园区

  • 重点在这几部分:GSC,结构化数据,JS,AMP,安全
  • 技术方面的推动:MFI( Mobile First Indexing )和速度
  • 将会更新更多关于质量的算法
  • voice search

GSC 更新

Google 园区内的自行车

Google 园区内的自行车,比 Mountain View 的自行车要新一点

  • MFI 部分更新
    • Coverage 部分将会包含 mobile 爬虫的抓取
    • 将会有 MFI 的索引数据
    • URL Inspection 将添加新功能:MFI 检验
  • Domain 配置
    • 主域名将覆盖所有的子域名
    • 将覆盖 HTTP 和 HTTPS
  • URL Inspections 将添加以下内容
    • 快照截图
    • HTTP headers 内容
    • 源代码
    • JS 日志

分享来自 Sion Schori - software engineer for GSC。

JavaScript sites

这部分分享来自 Martin Splitt - Webmaster Trends Analyst。

  • 背景是现在很多网站给用户端传送较小的 HTML 框架,然后用 JS 动态传输内容,比如 Angular, React, Vue, Polymer 等。而 Google 在抓取动态内容时,效率较低。
  • 所以,Google 非常推荐这类网站使用 dynamic rendering 的形式,类似下方:

dynamic rendering

  • dynamic rendering,对于某些使用 JS 加载内容的网站,可以添加一个模式,当访问者是 spider 时,在服务器端渲染完成后再返回(笔者注:其实国内百度文库,携程火车票,已经是这种形式了。)

Ranking Q&A

Paul Haahr 和 John Mueller

上图为 Paul Haahr 和 John Mueller

Paul Haahr! Google's Top Ranking Engineer, 2002 年加入 Google,之前一直与 Matt Cutts 合作。

  • Google 如何进行更新?
    • Paul:很多方式。比如展现形式的驱动,query 的驱动,也可以细分为全球语言性和地域性。
  • 最重要的排名因素是什么?
    • Paul:不是单一的因素。query 不同,主要因素不同。比如长尾和宽泛的 query,主要因素不同。再比如 local 相关的 query,因素也不同。 Google 还希望建立一个机制,当用户 query 不准确时,也能返回准确的结果。
  • Google 是否会将搜索结果随机化,从而迷惑 SEO
    • Paul:不会的。搜索结果的变化性,是因为持续调整的算法,在线的实验、以及动态变化的索引。这些都在变化,所以复现搜索结果是基本不可能的。但有趣的是,虽然有这么多变化因素,但网页的得分基本保持不变。
  • 有很多的网页质量评测员,他们在做什么?
    • Paul:他们是很关键的,会帮助评测算法的影响,比如在搜索结果去看算法带来的真实的变化。每个迭代会有多个评测员,以及几百个搜索结果。
  • 我们从哪里可以获取到最新的算法更新?
    • Paul:lol. 很多时候,站长非常恐慌,而且他们不知道要做什么。Danny Sullivan 说他们确实谈到了一些更新,因为当站长知道发生了什么,并且知道要做什么时,这会很有用。比如 speed 更新是比核心算法更新要友好的,因为核心算法的消息是”不要做任何事情“。Google 工程师会尽量确保站长不要恐慌,并有一些针对性的行动,但也不希望他们把时间用在胡乱修复上。站长最好还是参考质量指南来做,质量是最关键的。
  • 制定算法,会用多长时间的数据?
    • Paul:我们会用近两个月的 query 数据和访问数据,并做采样。时间是很重要的。之前,Google 的更新主要是惩罚作弊,最近主要是提升质量。Spam 团队做了非常多的手动惩罚,全都通过 GSC 实现,他们跟算法和排名团队的沟通其实并没有那么多。
  • 我们可以访问内部工具吗?
    • Paul:不可以。Google 已经开放了很多东西,但搜索是怎么运行的,这还不能开发。这些工具对每个人并不是那么有用,除非是要查看特定黑帽技术是否有效。
  • 移动友好性是否有用?
    • JM:目前已经接近一半的站点是 mobile first 了。
    • Paul:响应式设计,以及如何为移动端用户提供内容是非常重要的。

AMP

AMP 的几个特征

上图为 AMP 的几个特征

来自 Paul Baukus 的分享。

  • AMP 应用在所有终端上,包含 PC,mobile,pad,Google home等
  • 60% 的 AMP 访问都在非新闻类站点上
  • AMP 的几个特征:组件丰富、快速、开发简单、类似 APP 的体验、与 PWA 无缝衔接
  • 关于 content mismatch:爬虫主要检验 canonical 和 AMP 的内容重合度

其他问题

Mountain View 园区的随拍

Mountain View 园区的随拍

  • 关于 voice search
    • JM: voice search 暂时不会出现在 GSC 中,因为不会带来什么流量。而且即便有了 voice 的访问数据,站长能做什么呢?

最后附上中国区参会者的合影:

中国区参会者

Comments
Write a Comment
  • 桃之流年 reply

    最近看到1688网中了飓风算法2.0,方便分析一下吗

    • @桃之流年 刚了解过了,1688这次流量问题跟飓风算法2.0没有关系。

      飓风算法主要是针对采集内容,而1688采集的内容已经屏蔽了抓取。

      而且飓风算法会惩罚特定的频道,而1688首页的排名都干掉了。

      所以1688的问题跟飓风算法没有关系,我们讨论的结论,更倾向于百度那边出了问题。