当梦想照进现实

【百度飓风来袭】网站被百度飓风算法处罚怎么办

2017.07.18

某网站中了飓风算法

前言

在百度站长论坛,看到有很多朋友提问,网站中了百度飓风算法,被飓风“吹成太监”,该怎么办好。在上一篇文章分析了飓风算法的命中范围。这次我们来谈谈解决方法。

被飓风算法影响怎么办

针对飓风算法的影响,百度一个朋友透露说:

飓风算法主要是针对没有价值的采集,一旦中招没有任何解法。而被误伤的优质原创可以通过反馈中心申诉。

因此,一旦被飓风算法命中,只要不是明显误伤,短期内都没有办法解决。(被搜素引擎算法命中,一般都是普遍存在的,不被搜素引擎接受的做法,一般没办法申诉,Google也是如此。只有人工处理的能申诉。)

如何避免被飓风算法命中

采集会被算法惩罚,而内容完全原创,成本又非常高。那如何生成内容,而又不被飓风算法惩罚呢。其实还是围绕内容增益上去解决,有几个解决方法:

增加用户点评模块

网易跟帖截图

页面增加用户点评模块,当有用户点评之后,点评内容也会成为网页内容的一部分,产生了额外价值。作为用户,在阅读完内容之后,也希望看一下真实用户的意见,比如这个内容是否属实,信息是否失效,有没有额外的提醒等。

不过要注意的是,点评内容最好是在源码中实现,而不是在JS中(方便搜素引擎识别)。

  • 推荐工具:友言,wumii(不保证内容出现在源码中)
  • 实现难度:★★★
  • 安全程度:★★★★
  • 示例:网易新闻跟帖

增加内容推荐模块

网页内容推荐部分

根据网页主题,添加相关的内容模块,比如延伸阅读,之前报道,相关阅读等。作为用户,可以更加详细完整的了解事件的发展,比如关于“张艺兴”的一篇新闻,可以了解他之前参加过什么活动,有什么绯闻,参与的极限挑战的进展情况等。这些对用户来讲,都是非常有价值的。

  • 实现思路:一种是人工编辑;一种是算法实现,比如根据TF-IDF提取出主体关键词,再拿关键词去跟历史内容匹配。
  • 实现难度:★★★★
  • 安全程度:★★★★
  • 示例:网易新闻下的延伸阅读

内容整合

网页的香港回归20周年专题

根据主题,将多篇内容整合为一篇。跟之前内容相比,整合后的内容更加丰富,可以满足用户更多需求。比如一篇“梦见老虎”的内容,如果能够添加“梦见老虎吃人”、“梦见被老虎追”等内容,将会更可能命中用户的梦境。

另一种比较常见的就是专题页,将相关主题的内容全部组织起来,按照重要程度安排内容布局。这种专题页有运营小伙伴编辑的,也有程序生成的(使用开源搜索引擎,比如Lucene,Sphinx,Xapian)。

申请百度原创

如果确实是优质原创内容,还是推荐加入百度原创保护项目。目前这个项目在内测阶段,需要百度邀请加入。如果对自己的内容非常自信,可以跟我联系,我可能会推荐给院长。

后记

  • 头图来自某网站受算法影响的截图;
  • 随着更新频率提高,感觉内容质量有所下降,需要反思下。

2017/8/7补充

以下是2017/8/5日手机的被飓风算法命中的网站:

被飓风算法命中的网站

Comments
Write a Comment
  • 1217719630 reply

    常规丰富页面内容也可以参照这个方法吗

    • @1217719630 当然可以的。这些本来就是常规的丰富页面内容的做法。只是从SEO角度,也可以产生附加的页面价值。

  • cheng reply

    感觉除了第二的实现可能性更大,第三程序生成的聚合页面算吗?虽然没有人工整理+单独页面设计效果来的好。

    • @cheng 第三种有见过人工的,也见过机器的。显然人工的效果更好,更有价值,就是需要运营成本。

  • cheng reply

    原始内容不经过处理加上第二条内容中出现推荐板块,站内机器自动生成聚合页面,这样会被飓风算法影响吗?

    • @cheng 第一个问题,要保证推荐模版的相关性,确实是对用户有帮助的,很多大型网站的推荐模块就是机器生成,但确实有帮助。第二个问题,聚合频道跟相关性算法有关系,如果相关性强,确实能帮用户解决问题,也是完全没问题的。而相关性差的例子也见过很多,跳出率高,很容易被判断为低质量页面。

  • 123123 reply

    别在这误导别人了。。。飓风算法是一点不能复制。 伪原创的站全挂了,小哥哥

    • @123123 我没有引导伪原创。我一直强调的是内容上的增益,就是在原有内容上产生新的价值。这一点无论哪个搜索引擎都没有问题。在Google的文档里有明确的说明。

      目前被惩罚的伪原创,都是简单的采集和发布,对内容基本没有加工,产生的附加价值也非常小。

  • 我们的网站也是,之前是百度照顾的重点对象,也是收到过邀请的,这次飓风算法后,网站基本流量为0,不知道后期该怎么做!

    公司被了怎么艰巨的任务,不知该向谁请求帮助,我们是伪原创的网站...

    小编有什么好的建议吗?

    • @mr small, 一旦被算法命中,不容易恢复。。你给领导说下这个是算法造成,并且列出一些受到影响的站点。

      要想改善,只能改变内容策略,不要直接采集,发布。要增加一些内容增益的处理,详细措施看我正文。

  • kk reply

    我们网站也是,主站以伪原创为主,之前排名特别好。分站资讯站采集。这次全挂。

    我想咨询的是,这种老内容怎么处理

  • 你好,可转载吗。哈哈,挺好的。