1、 搜索词的三种分类
搜索引擎把搜索词分为三类:Know,Do和Go,以下是关于三类搜索的简单解释:
- Know,信息性搜索,这类用户想要了解某些信息,如“南京五一天气怎样”,“南京五一有哪些地方好玩”等。
- Do,事务型搜索,这类用户想要完成某个目标或参与某个网上活动。他的目标可能是下载,购买,娱乐等,比如“美图秀秀下载”,“植物大战僵尸online”,“cheap mp3 player”等。
- Go,导航型搜索,这类用户是要到达某个特定网页,比如“中国制造网”,“优酷”,“新浪微博”等。
另外,很多搜索词会有不止一种用户意图,比如“ipad”,用户可能想要ipad的简介(Know型),可能想要到达ipad的官网页面(Go型),也可能是想要购买ipad(Do型)。
- 便于关键词分析。将关键词按用户意图区分,可以更了解这些关键词背后的含义,有利于对关键词做更好的布局。
- 方便关键词拓展。可以根据关键词的3种分类去对照自身网站,看是否有关键词拓展的空间。
关键词分类对电商类网站尤其重要,比如电商类要将事务型搜索关键词作为网站转化的重点;还有淘宝客,可以说最核心的就是如何找到转化率高的长尾关键词;我之前工作过的医疗网站也是,寥寥几个事务型关键词(多为地区类病种词)几乎可以占据每天转化量的一半。
2、用户意图
之前一直以为影响网页排名的只有2个因素:网页与搜索词的相关性和网页的重要性。看了文档才知道有个更高级的因素,那就是用户意图。其实也很容易理解:搜索引擎的目的就是满足用户的搜索需求,因此搜索引擎会先根据用户搜索词判断用户意图(简单分为Do,Go和Know型),然后给出符合需求的一类网页,接着才会根据相关性和重要性对这一类页面进行排序。
例如用户搜索”宫保鸡丁“,而我有个网页是”宫保鸡丁的来历“,虽然我的网页相关性很强(关键词位置,密度,内外链等),也有很多高质量外链,但考虑到搜索这个词的大多数用户都想要知道”宫保鸡丁的做法“,只有极少数是想了解”宫保鸡丁的来历“,所以第一步就落后了,之后也不太可能有很好的排名。除非用户搜索”宫保鸡丁的来历“,这个网页因为很符合用户的需求,排名才会靠前。
也就是说,要想让某个关键词的排名靠前,首先要分析这个关键词,了解搜索这个关键词的用户想要得到什么信息,然后根据用户需求去组织页面,这样才可能获得理想排名。也就是说,如果网页是”宫保鸡丁的来历“,那还是不要把精力放在”宫保鸡丁“这个排名上了,因为匹配度太低了。
这东西说来很虚,但用户和搜索引擎都喜欢,可以看看夜息哥哥这篇文章http://www.imyexi.com/?p=853,花很大精力搞卡片分拣就只是为了满足用户需求,在侧边栏放上用户需要的链接。这些链接虽然不起眼,但想想如果有成千上万个页面都放上了用户更感兴趣的链接,那效果就不可同日而语,这其实也是产品,运营,体验的工作。
3、 网页评级
谷歌根据用户意图与页面的匹配程度,将搜索结果分为5种类型:至关重要型,实用型,相关型,基本相关型与离题或无价值型。
- 至关重要型。一个页面可以满足用户的所有搜索意图,多用于导航型搜索。
- 实用型。页面质量高,可满足大多数用户的需求。
- 相关型。跟搜索需求相匹配,可以满足部分用户的需求。
- 基本相关型。对大多数用户不那么有价值,但多少跟搜索需求相关。
- 离题或无价值型。跟搜索请求不匹配,或者没有实际价值,对绝大多数用户没有帮助。
结合用户意图的解释可以得到2点:
- 只有符合用户意图,满足用户主体需求的页面,评级才会高,排名才会靠前。比如搜索”宫保鸡丁“时为什么”宫保鸡丁的来历“排名较低,因为他没有满足搜索者的主体需求,只是跟搜索词算是基本相关。
- 如果页面内容与关键词匹配度不高,评级低,无法获得很好的排名。例如“宫保鸡丁的来历”想要获得“宫保鸡丁”的排名。
相对于用户意图,那些关键词密度,H标签什么的简直弱爆了。
4、 关键词堆砌
谷歌对关键词堆砌的分类:
- 关键词在页面上重复多次
- 关键词的相关词在页面上重复多次
- 关键词的拼写错误在页面上重复多次
- 页面上存在大量胡乱的随机的关键词
- 页面上存在大量程序自动生成的文本,并没有任何意义。
谷歌对关键词堆砌的处理方式:当页面上关键词数量过多,干扰了用户的正常访问,那就会认定为关键词堆砌;而如果没有察觉到关键词数量的影响,那将不被认为是堆砌。
有时候我们把搜索引擎想象的太弱智了,不是吗?!
5、 对网页语言的判断
谷歌已有很成熟的技术去判断网页语言,而不仅仅依靠HTTP响应头部的Charset和Content-Language。比如Google Translate的API里就有相应的功能,能识别网页的语言。(具体可以看谷歌翻译API里的detect source language一项。)
也就是说,如果Charset和Content-Language设置为中文,不一定会被谷歌认为是中文网页,只是会干扰谷歌的判断。
另外,这不表示Charset和Content-Language设置错误没有影响,Charset和Content-Language的合理设置会让网页更加规范,也避免了用户在浏览网页时弹出其他字符集下载。
国平老大以前提出来的,其实也并没有想象中那么有效。
注:
由于涉及网站情况,已经将MIC的部分内容删除。