当梦想照进现实

【翻】搜索质量评分指南

2013.03.29

V1.0

2012.11.2

由于一直偷懒,已经有人完全翻译出来,我转为PDF传到了百度网盘,地址是:http://pan.baidu.com/share/link?shareid=501939&uk=3708744239。译者也不知道是谁,先在这里表示感谢。
最后,本文是否会翻完还不确定,不过因为已经有了完整版,速度会更慢些。

前言

谷歌依靠在分布在世界各国家,不同语言的评分人员,衡量我们的搜索结果,排名,体验的质量。这些评分人员通过执行各种的测试任务,反馈给我们各种搜索请求的各种搜索结果的质量信息。他们产生的这些数据会形成统计,作为对我们的搜索结果与搜索体验的质量的根据,也会作为搜索算法改进的效果的验证。评分人员的判断并不会直接影响谷歌搜索结果的排名。当评分人员对一个特定链接评分,这个分数也不会直接提高或降低这个网站的排名。但是,这些分数会作为改进算法的根据之一,帮助我们做出改进的决定。

这个文档是我们搜索质量评分指南的精简版。也就是说,这个并不是评分人员日常使用的完整版本,但这个是重要部分的摘要。评分人员版本包括评分界面的介绍,其他评分示例等。那个版本是专门用于搜索评分人员,而这个版本是聚焦于评分任务中的核心部分:URL评分。在URL评分任务中,评分人员拿到一个搜索请求(根据他们当地信息,包括国家和语言),以及一个URL(URL是这个搜索请求结果中的)。评分人员根据文档中的描述,来对搜索请求中那个指定结果进行评分,听起来很简单吗?但就像你看到的,评分的时候有太多方面需要考虑,这个文档就是指导你如果对复杂的情况进行评分。

我们的搜索质量评分指南仅是当前的版本,今后讲不断更新。我们做了这个精简版是为了让他们更好的了解谷歌是如何考虑相关性和搜索结果的质量。

第一部分 评分指南

1.0 欢迎来到评分指南项目

作为一名搜索质量评分人员,你讲面临各种各样的评分项目。这个指南仅包括其中一种:URL评分。

请花时间认真阅读这个指南。这里的说明对其他类型的评分也非常重要。当你做URL评分的时候,你讲很快成为一名成功的搜索质量评分人员。

1.1 URL评分概要

你接手的每个URL评分任务,都会看到一个搜索请求和URL。你需要:

  • 按搜索请求进行搜索
  • 点击URL访问着陆页面
  • 按照本指南进行评分

1.2 重要的定义和概念

搜索引擎

搜索请求
用户意图
任务语言和任务区域
主页
子页

网页

URL
着陆页
主题
实用性
评分等级讲在评分指南第一部分的第四节详述,这里是个概要。对每个任务来说,你要准确给出下面一个评分:

评分等级 描述
核心 特定的评分等级,详情请看评分指南的4.1节
实用 页面对大多数用户有帮助
相关 页面对部分用户有帮助
基本相关 页面对大多数用户并不是那么有帮助,但多少跟搜索请求相关。少数用户会认为页面有帮助
离题或无价值 页面对极少数用户有帮助,或没有任何帮助
无法评分 无法评级的页面。完整描述在评分指南的4.6节

1.3 搜索评分指南的目的

你的评分将用于改进全球范围的搜索引擎质量。谷歌搜索引擎根据用户的语言和地域给出有价值的结果。请注意,你的评分并不会直接影响谷歌的搜索结果排名或排名算法。

1.4 评分人员要从用户的角度出发

评分时从用户的角度出发是非常重要的。用户就是居住在任务指定的区域,使用任务指定的语言,将搜索关键词输入到搜索框的某个人。

你必须非常熟悉任务指定的区域和语言,这样才能更好的感受当地用户的体验。如果你的知识不足,请通知你的上级。

1.5 互联网安全信息

在你的工作过程中,你将访问各种不同的网页。除非你很小心,否则部分页面会威胁你的电脑安全。因此请不要下载任何可执行文件,应用,有潜在危险的文件,以及点击你认为可疑的链接。我们强烈推荐您在电脑上安装杀毒软件和反木马程度。这个软件必须可以频繁更新,否则你的电脑将不被保护。目前网络上有许多免费和收费的杀毒软件和反木马软件。
(未翻完)

2.0 理解搜索请求

在你进行评分之前,你必须理解这个搜索请求。请使用适合你地区的在线词典或百科或者在网上搜索来帮你理解搜索请求的全部含义。
重要:当你使用搜索引擎理解搜索请求时,请不要仅依赖于搜索结果排名靠前的网页。除了排名靠前的网页外,这些搜索请求可能包含其他含义。不要因为网页在搜索结果中排名靠前就给他很高的评分。

以下是几个可能对你有用的线上资源:

网上百科:

  • http://en.wikipedia.org/wiki/Main_Page - 英文版的维基百科
  • http://en.wikipedia.org/ - 其他语言和版本的维基百科

翻译工具:

  • http://www.bing.com/translator/
  • http://www.wordreference.com/
  • http://translate.google.com/

2.1 理解用户意图

除了理解搜索请求的含义,你还必须考虑用户意图。当用户输入这个搜索请求的时候,他们想要获得什么?你需要理解用户意图,然后再为着陆页面评分。

考虑下这个请求[tetris],英语(美国)。大多数使用这个搜索请求的以英语为母语的美国人都了解Tetris是一个著名的电脑游戏。最可能的用户意图就是想在网上玩这个游戏。

这里有几个搜索请求和意图的例子:

搜索请求 最可能的搜索意图
[Fedex],英语(美国) 追踪一个包裹,或寻找Federal快递点
[calendar],英语(美国) 寻找,定制,为本月或本年打印一个日历
寻找一个显示节日的日历
寻找网站日历规划某人的时间
[ebay],英语(美国) 想在eBay上买或卖,或者导航到eBay的首页上

2.2 任务语言和任务区域

所有的搜索请求都有一个任务语言和任务区域。牢记这些会帮助你理解搜索请求和用户意图。不同地区的用户对同一搜索请求有时候会有不同的期望。

搜索请求 任务区域内的含义 任务区域内用户可能的意图
[football],英语,(美国) 美式足球,即橄榄球,使用棕色的,椭圆形的球 美国地区用户寻找橄榄球类最近的比赛得分,赛程,图片,队伍信息等
[football],英语(英国) 英式足球,使用圆球,美国人称为soccer 英国地区或者全球用户寻找足球最近比赛得分,赛程,图片,队伍信息等

2.3 有多个含义的搜索请求

很多搜索请求有不止一种含义。例如,搜索请求[apple],英语(美国)可能表示电脑品牌,也可能是水果。我们将这些含义成为搜索解读。

主导解读:主导解读是指进行这个搜索请求时,大多数用户都想要这方面信息。例如,大多数用户输入[windows],英语(美国)都想查找微软操作系统的信息,并不是墙上的玻璃窗户。你应该对主导解读很确定,特别是进行了一些网上搜索之后。

一般解读:很多情况下是没有主导解读的。比如搜索请求[mercury],英语(美国)可能涉及汽车品牌,星球,或者化学元素(Hg)。当没有明确的主导解读时,所有解读都将是一般解读。很多用户都想要这些解读的搜索结果。

次要解读:有时你将发现一些不常见的解读,这些解读只有少数用户想要这方面信息。比如上面提到的[mercury],英语(美国),用户可能想要查找Mercury Marine Insurance和San Jose Mercury News的信息,而这些大多数美国英语用户都不知道什么意思。这个就是次要解读。

当你对涉及次要解读的页面评级时,你要给出较低分值。在评分指南的5.4节,我们会详细讨论搜索请求有多个含义时如何为页面评分。

2.4 用户意图的分类:事务型,信息型和导航型 - "Do - Know - Go"

有时将用户的搜索意图按照这三种分成一类或多类是有帮助的。

  • 事务意图。用户想要完成一个目标或参与某个活动,比如下载软件,玩网络游戏,送花,寻找娱乐视频等。这是"Do"意图:用户想要做某件事。
  • 信息意图。用户想要查找信息。这是"Know"意图:用户想要知道某些信息。
  • 导航意图。用户想要到达某个网站或网页。这是"Go"意图:用户想要到达特定页面。

一个容易记忆的方法是:Do-Know-Go。对搜索分类可以帮你更容易的对网页评分。请注意,很多搜索请求适合不止一种用户意图。

2.4.1 事务型搜索 - Do

事务型搜索的意图是完成某个目标或从事网上活动。他的目标或目的可能是下载,购买,获取,娱乐,或者与网上某资源交互。

用户想要做(Do)某些事情,下面是一些目标和目的的例子:

  • 购买某个产品
  • 免费/付费下载软件
  • 线上付款
  • 玩网络游戏
  • 打印日历
  • 网上订花
  • 网上处理照片或下单打印
  • 观看视频短片
  • 复制图片或剪切画
  • 进行线上调查
  • 浏览娱乐网页,比如图片,消息,视频等

这类事务型搜索的有价值页面是那些可以帮助用户从事某个活动或完成某个目标的页面。

搜索请求 可能的搜索意图 着陆页面的描述
[geography quiz],英语(美国) 进行网上地理测试 具有可用的网上地理测试的页面
[Beatles poster],英语(英国) 寻找或购买披头士乐队的海报 可以查看或购买披头士乐队海报的页面
[download adobe reader],英语(英国) 下载软件 Adobe官方网站的免费下载页面
[fairy tale coloring pages],英语(英国) 打印着色页 有可打印着色图的页面
[online personality test],英语(英国) 进行线上个性测试 具有可用的网上个性测试的页面
[what is my bmi?],英语(英国) 计算BMI(质量指数) 具有可用的BIM计算的页面
[good cop baby cop],英语(英国) 观看“good cop baby cop”的视频 可以观看这个视频的页面
[cute kitten pics],英语(英国) 查看可爱小猫的图片 可以查看可爱小猫图片的页面
[Citizen Kane DVD],英语(英国) 购买这个DVD 可以购买这个DVD的页面
[flowers],英语(英国) 网上订花 可以网上订花的页面
[play sudoku],英语(英国) 网上玩九宫格游戏 可以玩九宫格游戏的页面
[calculate running pace],英语(英国) 网上计算跑步速度 有可用的步速计算器的页面
[bubble spinner 2],英语(英国) 网上玩bubble spinner,或者下载bubble spinner 可以在网上玩bubble spinner,或提供下载的页面
[Spanish English dictionary],英语(英国) 把西班牙单词翻译为英语或英语单词翻译为西班牙语 提供西班牙语-英语或英语-西班牙语翻译的页面

2.4.2 信息型搜索 - Know

信息型搜索是寻找某个话题的信息。用户想要知道(Know)某些事情,目标是找到信息。
信息型搜索的有价值页面是指高质量的,权威的,综合型信息的页面。

搜索请求 可能的搜索意图 着陆页面的描述
[Switzerland],英语(美国) 为假期旅游查找旅游信息,或者寻找瑞士的地理,语言,经济信息 关于著名的瑞士旅游攻略的页面。
关于瑞士的世界概况的综合性页面
[crytology use in WWII],英语(英国) 寻找第二次世界大战中细胞学的应用信息 美国空军博物馆网站上关于第二次世界大战中细胞学的文章
[how to remove candle wax from carpet],英语(英国) 寻找怎么清除地毯上的蜡的信息 某个著名杂志网站上拥有关于这条信息的页面

2.4.3 导航型搜索

导航型搜索的意图是到达某个特定网页。用户头脑中已有某一特定的网页或网站。这个特定页面称为搜索请求的目标。用户想要到达(Go)目标网页。
导航型搜索最有价值的页面是导航的目标页面。

搜索请求 可能的搜索意图 目标页面的URL 目标页面的描述
[ibm],英语(美国) 到达IBM首页 http://www.ibm.com/ IBM的官方主页
[youtube],英语(美国) 到达YouTuBe首页 http://www.youtube.com/ YouTuBe的官方主页
[ebay],意大利语(意大利) 到达eBay的意大利官方网站 http://www.ebay.it/ eBay意大利的官方网站
[harvard college admissions],法语(法国) 到达哈佛大学官方网站的入学申请页面 http://admissions.college.harvard.edu/index.html 哈佛大雪官方网站的入学申请页面
[sony customer support],英语(美国) 到达索尼官网的客户支持页面 http://esupport.sony.com/ 索尼官网的客户支持页面
[outback steakhouse menu],英语(美国) 到达Outback的菜单页面 http://www.outback.com/menu Outback Steakhouse官网的菜单页面
[cannon.com digit cameras],英语(美国) 到达佳能官网的数码相机页面。尽管佳能主要是以数码相机出名,但搜索请求的目标是数码相机页面,而不是佳能首页。 http://www.usa.canon.com/consumer/controller?act=ProductCatIndexAct&fcategoryid=113 佳能官网的数码相机页面
[facebook login],英语(美国) 达到facebook的登录页面。尽管用户可以在facebook首页上登录,但搜索请求的目标页面是登录页面,并不是首页。 http://www.facebook.com/login.php Facebook网站的登录页面

2.4.4 多种意图的搜索请求(Do-Know-Go)

许多搜索请求有不止一种用户可能的意图。当不确定是否有不止一种意图时,请多思考去判断。这里有一些示例:

搜索请求 可能的搜索意图 有价值页面的URL 着陆页面的描述
[download firefox],英语(美国) DoGo。这是一个事务型和导航型搜索。部分用户想要下载firefox浏览器(Do型),部分用户想要从Firefox官方网站上下载浏览器(Go型)。 http://download.cnet.com/
mozilla-firefox/
着陆页面是著名的enet.com网站上关于Firefox下载的页面。很多用户在这个网站下载时体验很满意。这个页面对事务型搜索来说是有价值的。
http://mozilla.com/
en-US/firefox/firefox.html
着陆页面是Firefox浏览器的官方下载页面。这个页面是导航型搜索的目标页面,对导航型搜索和事务型搜索都是有价值的。
[Nikon digital cameras],英语(美国) DoKnowGo。这个属于事务型,信息型和导航型搜索。用户对尼康的数码相机很感兴趣。部分用户可能打算购买尼康相机(Do),但部分用户可能想了解Nikon品牌(Know),也有部分用户想要到达尼康官网的数码相机页面。 http://www.target.com/
s/nikon+digital+cameras
着陆页面是target.com上的Nikon页面。页面上有60多款在售的尼康数码相机,包括相机的价格,规格和评论。这个页面对事务型搜索和信息型搜索都是有价值的。
http://reviews.cnet.com/
digital-camera-reviews/?filter=1000036_108496_
&tag=centerColumnArea1.0
着陆页面是cnet.com上的尼康数码相机评论页面,这个页面有尼康数码相机不同型号的各种有用信息,可以根据价格,分辨率,数码相机类型和特色来分类,还可以让用户对比价格,特色等。这个页面对信息型搜索是有价值的。
[ipad],英语(美国) Do,KnowGo。这个属于事务型搜索,信息型搜索和导航型搜索。部分用户可能想购买一个ipad(事务型),部分用户可能是想了解下(信息性搜索),还有部分用户是想去苹果官网的ipad页面(导航型搜索)。 http://www.engadget.com/
2011/03/09/ipad-2-review/
着陆页面是engadget.com上关于ipad的综合性的评论页面。这个页面对信息型搜索有价值。
http://www.apple.com/ipad/ 着陆页面是苹果官网上的ipad的产品页面。这个页面可能是导航型搜索的目标页面,对导航型搜索和信息性搜索是有价值的。
http://store.apple.com/
us/browse/home/
shop_ipad/family/ipad?mco=OTY2ODA0NQ
着陆页面是苹果商店的ipad页面。用户可以购买和查找信息。这个页面可能是导航型搜索的目标页面,对事务型搜索,信息型搜索和导航型搜索来说都是有价值的。

3.0 着陆页的语言

你需要掌握你的任务语言和英语的阅读和理解能力。你需要了解所在地区的很多常用语言。
所有的着陆页需要做如下几个标注:

  • 任务语言
  • 可接受的语言
  • 英语
  • 外语
  • 以上都不是

任务语言:当页面内容全部是或大多数是任务语言时,将着陆页面标注为任务语言。
可接受的语言:当页面内容全部是或大多数是适当的可接受的语言时,将着陆页标注为可接受的语言。
英语:当页面全是或大多数是英语时,标注为英语。
外语:当你确信任务地域内用户不能阅读和理解页面内容的语言时,标注为外语。
以上都不是:当页面没有语言可以识别时,做这个标记。例如页面上全是空格,页面上只有图片,页面上全是混乱文字,或者无法识别语言的编码错误。
对于混合语言的页面:认真判断。不要太纠结于选择哪项语言标注。

4.0 评分等级

页面评分基于用户意图和着陆页的实用性,分为5个等级:核心实用相关基本相关,以及离题或无价值。另外,还有个评分等级用在特殊的环境下:无法评分

4.1 核心评级

核心的评级应用在以下特殊环境下:

  1. 搜索请求的主导解读是导航,而且着陆页是导航的目标页面。
  2. 搜索请求的主导解读是一个实体(例如一个人,地点,生意,餐馆,产品,公司,组织等等),而且着陆页是关于这个实体的官方网站。

在以上两种情况下,搜索请求必须是主导解读。如果不是主导解读,那就一定不能评为核心
大多数核心的页面都是有帮助的。但请注意:并不要求核心的页面都有帮助。有些核心的页面是官方网站,但并不十分有帮助。

4.1.1 核心的概念

大多数搜索请求并没有核心的网页。这里是几种没有核心网页的情况:

  • 搜索请求并没有一个主导解读
  • 搜索请求不是一个实体,也不是导航型搜索
  • 搜索的实体不存在官方网站或网页
  • 搜索请求并不能用某个人物或实体概括

下面是没有核心页面的搜索示例:

搜索请求 核心页面 描述
[ADA],英语(美国) 没有核心页面 没有主导解读。下面的实体都是普通解读。每个解读都有官方网站,但由于没有主导解读导致没有一个是核心页面。
Americans with Disablities Act
American Dental Association
American Diabetes Association
[knitting],英语(美国) 没有核心页面 这是一个信息型搜索,knitting(针织)是人们从事的某个活动,也有人建立了相关网站。但没有一个关于针织相关资源的官方网站。没有人能完全概括这个话题。
[diabetes],英语(美国) 没有核心页面 这是一个信息型搜索。没有人或组织拥有diabetes(糖尿病)这个话题,因此也不会有官方网站。
[ipod reviews],英语(美国) 没有核心页面 ipod是搜索一个实体,但是ipod reviews却不是。ipod reviews是一个信息型搜索,用户想要寻找相关信息,但很多网站都可以提供,并没有一个官方的此类网站。
[how old is britney spears?],英语(美国) 没有核心页面 [Britney Spears](小甜甜布兰妮)是搜索一个实体,但[how old is britney spears?]不是,这是一个信息型搜索,很多网站都会提供这个信息,但没有官方网站。

4.2 实用评级

实用评级是指对大多数用户非常有价值的页面。实用页面应该是高质量的,跟搜索请求十分贴切的。另外,这类页面应该有以下几种或全部特点:令人高度满意,权威的,令人愉快的,或者最近的(例如突发的新闻或话题)。
实用页面通常被很好的组织,并且是可信任的。他们都是可靠的信息来源。
实用信息页面并不是充满广告的。
请注意:在一个搜索请求中不止一个页面可以标注为实用页面

4.3 相关评级

相关评级是指对许多用户有价值的页面。相对于实用页面,相关页面有较低价值的贡献。相关页面仍然是切合搜索需求的,但是可能不那么丰富,或有点过时,或资源不那么权威,或只是包含了搜索需求中的某一重要方面。

相关页面必须是对用户有价值的,而且是符合搜索需求的。相关页面不能是低质量的,算是一般好。

4.4 基本相关评级

基本相关评级是指那些对大多数用户不那么有价值,但是多少又跟搜索请求相关的页面。基本相关页面可能是低质量的,也可能包含不那么有价值的内容。基本相关页面可能只是满足用户的次要需求,或有过时的信息,或者太特指,太宽泛等等,无法得到一个很高的评分。

基本相关页面也可以是显示在常规URL评分任务中的移动端着陆页(与搜索请求相关的)。为移动端用户设计的网页是与使用台式电脑的用户是不同。显示的内容不同(通常提供更少内容),页面功能也不同。另外,如果移动端着陆页与搜索请求不匹配,应该评为离题或无价值

4.5 离题或无价值评级

离题或无价值页面是哪些对极少数用户有帮助或没有任何帮助的页面。离题或无价值页面是跟搜索请求无关,或者没有实用性的页面。

当页面没有提供满足用户主要需求的内容时,页面就该标记为离题或无价值

4.6 无法评级

无法评级页面是针对那些不能评分的页面。因为你会遇到很多类型的无法评级页面,请用下面无法评级页面的类型去描述搜索结果:

  • 无法加载
  • 外语

请注意,你可以对一个页面增加不止一个无法加载的标记。例如,如果一个着陆页用外语显示了一个错误信息,并且没有任何内容(例如,页面属于评分指南4.6.1中描述的无法加载一类。),你可以将他评为无法评级:无法加载无法评级:外语

4.6.1 无法评级:无法加载

无法评级:无法加载(通常成为无法加载)是指确实无法加载,或没有任何内容的一类特别页面。这类页面通常提示网络服务错误或网络应用错误信息,并且没有其他内容。
无法加载的页面通常有以下几种情况:

  • 页面提示错误信息,**并且没有其他内容**
  • 页面有无价值的跳转,**并且没有其他内容**
  • 完全空白页面
  • 有恶意软件警告的页面,例如“警告 - 访问这个网站可能伤害你的电脑!”
  • 需要身份认证的页面

请注意:如果遇到有安全提示信息或者需要身份认证的网页,不必标记为广告页面恶意页面。因为有很多正常的网页也会出现这类提示。
如果遇到一个页面有警告信息或身份认证请求,请标记为无法加载。除非有其他原因,不要标记为广告页面恶意页面
广告页面恶意页面标记的表述在评分指南的6.1和6.3节。
以下是警告信息的示例图:

警告信息的示例图

以下是身份认证请求的示例图:
身份认证请求的示例图

访问http://en.wikipedia.org/wiki/List_of_HTTP_status_codes,浏览各种错误类型提示信息的描述。就像这个维基百科文章中看到的,有很多种网络服务器错误和错误信息。最常见的是以下几种类型:

  • 401 - 未授权的
  • 403 - 禁止访问的
  • 404 - 找不到的
  • 500 - 服务器端网络错误
  • 503 - 服务器端服务不可用

部分加载的页面或有错误链接的页面应该根据其实用性评级。
以下几个例子就是提示各种类型的错误信息(或者没有内容),应该标记为无法加载的页面。

搜索请求 着陆页面错误信息 评级 说明
[Douglas Instruments]英语(美国) “404找不到。对不起,你请求的页面在服务器上找不到。” **无法加载** 页面提示404错误,并且没有内容,应该评为**无法加载**
[SIAD]英语(美国) “你无权访问这个页面。你提供的证书不允许访问这个目录或页面。” **无法加载** 页面提示403错误,并且没有内容,应评为**无法加载**
[electionwatch2009.com]英语(美国) “警告 - 访问这个站点可能伤害你的电脑!” **无法加载** 有安全警告信息的页面应该被评为**无法加载**
[hat shipping]英语(美国) 网站正在建设中 **无法加载** 页面没有内容,只有提示“网站正在建设中”,应评为**无法加载**

另外,有错误信息但有相关内容或有意义链接的页面,评级应该考虑他们的实用性。这些页面的错误信息通常是由网站站长设置,但有时也不是。重要的时候是寻找页面上的内容或有意义的链接。

请注意,有时候无法加载错误信息的链接或文本可能被误认为内容,但这些链接或“内容”是来自信息的通用发布者,并不是创建着陆页相关的网站站长。
当你评为无法评级:无法加载时,请将着陆页面上的错误信息复制粘贴到评分任务的评论部分。
为无法加载页面选择一个着陆页面语言。
你需要为每个评分页面选择一个着陆页语言旗帜,尽管页面无法加载:

  • 为任务语言的页面标注为相应的**任务语言**旗帜
  • 为可接受语言的页面标注为合适的**可接受语言**旗帜
  • 为英语页面标注为**英语**旗帜
  • 为那些不是任务语言,可接受语言和英语的页面标注为**外语**旗帜
  • 为那些空白页面,乱码页面,无法加载的页面标注为**以上都不是**旗帜

对完整的标注着陆页语言的说明,请看评分指南的3.0节。

4.6.2 无法评分:外语

无法评分:外语页面是指那些不属于任务语言,可接受语言和英语的页面。

当你为着陆页选择外语选项时,大多数情况下你都会选择无法评级:外语
只有当你为特殊的核心页面时,你才不需要使用无法评级:外语。 关于核心页面的内容请看评分指南的4.1.5部分。

尽管有时你自己理解页面的语言,也相信可以做出正确评级,甚至你能说明这个页面是离题的,但无法评级:外语评级仍然适用于各种类型的搜索请求以及所有的外语页面。当你不确定时,请使用无法评分:外语标记。
无法评分:外语评级适用于所有类型的搜索请求和外语页面,

5.0 评分:从用户意图角度评分

在之前的评分指南中,你会浏览搜索请求和评分度量。在这一节,你将把所有结合起来。以下是评分时最重要的因素:用户意图和页面实用性。这也一直是所有URL评分任务的核心。
本节还有其他重要因素:

  • 你在评分任务中必须代表用户。你必须以用户的角度评分。
  • 很多搜索请求有多种含义或多种用户意图。不匹配的解释或意图应该给与较低评分。
  • 评分人员不同于普通用户。对评分人员有帮助的搜索结果不一定对普通用户有帮助。
  • 所在地是很重要的。最好的搜索结果应该与搜索所在地域符合。

5.1 用户意图和页面实用性

理解用户意图是很关键的。你在给着陆页面评分时,需要基于着陆页与搜索需求背后的用户意图的匹配程度。为了完成这个任务,你需要使用下面几条:

  • 你在任务区域下使用任务语言的丰富经验
  • 你的基本常识
  • 网络搜索

不过还好,对大多数搜索查询来说,用户意图是很容易理解的。
如果你认为这个页面对用户来说没有价值,请给一个较低的评分。一个相关页面对用户来说必须有实用性;一个基本相关页面有较低的实用性,但仍然是主题相关;一个离题页面没有任何实用性,并且/或者与主题无关。
不必纠结于每个评分,给出你认为的最佳评分,然后进行下一个。如果你在2个评分中无法定夺,请使用较低的评分。甚至有时,你在3个评分中发愁。此时,你应仔细考虑,给出最佳答案。
最后,尽管你不是仅仅依靠URL进行评分,但评分过程中观察URL有时候是很有帮助的。以下几种情况在观察URL时会有帮助:

  • 对于广告的识别
  • 对于识别各种跳转
  • 对于识别各种**核心**页面

请记住,评分时你必须访问着陆页面。

5.2 地域是重要的

好的搜索引擎会根据所在地域返回搜索结果,这意味着对用户来说在特定区域内的搜索结果才是最好的。例如,一个英语(美国)的用户搜索[pizza],他并不会对伦敦的披萨餐厅感兴趣,他需要的是美国的披萨餐厅。需要注意的是,如果在搜索请求中没有特别注明,我们默认大多数用户都是需要他们所在地域的网页。
大多数情况下,如果网页地域在其他国家,你需要给出较低评分。当任务区域与搜索结果中的结果不匹配时,不要犹豫,直接给以离题评级,除非用户在任务区域。

5.3 语言是重要的(本节专指非英语的任务语言)

如果你的任务语言是英语,例如英语(美国),英语(英国),英语(加拿大)等,你可以跳过本节。
大多数情况下,当着陆页面不是任务语言,英语或者其他可接受的语言时,你都会使用无法评分:外语这个评级。(请参照评分指南中4.1.5节的外国核心页面评级)
对任务区域的用户来说,着陆页面是任务语言无疑是不错的选择。
尽管他们不被认为是外语,但着陆页面是英语或其他可接受语言对任务区域的用户来说都不算一个完美匹配的结果。例如,在某些国家,英语普及率很高,英语页面在这些国家就算是很合适的着陆页面。但在其他国家,英语普及率很低,英语页面就不那么合适了。
另外,有些搜索请求是需要英语或可接受语言的结果,但有些不是。当给英语页面或可接受语言页面评分时,请基于他们对用户的帮助程度。记住,当页面对太多数用户没有太大帮助,但多少跟搜索需求相关,请使用基本相关评级。
在某些地区,英语是官方语言之一或常用的口头语言,在这些国家的用户看到英语的着陆页面时就会很容易接受。例如新加坡政府识别4种官方语言:英语,马来西亚语,韩语,泰米尔语,但英语是新加坡的第一页,也是最重要的语言。

5.4 多重解读

你在给页面评分时会遇到这些搜索请求,他们有多种解读以及多种用户意图。

  • 一般来说,对应搜索请求的次要解读,并只满足少数用户的需求,将给以较低评分。
  • 页面对应搜索请求的一般解读,并满足了多数用户的需求,就不应给太低评分。
  • 只有对应搜索请求的主导解读,才属于**核心**页面。

下面是一些示例:

搜索解读 示例 评分范围
核心解读:所有输入这个搜索请求的用户中,绝大多数用户都想要这类结果 [apple],英语(美国):苹果电脑。输入这个搜索请求的大多数用户都想要关于苹果电脑的搜索结果。
[windows],英语(美国):微软的操作系统。输入这个搜索请求的大多数用户都想要关于微软windows操作系统的搜索结果。
[amazon],英语(美国):著名网站www.amazon.com。输入这个搜索请求的大多数用户都想访问亚马逊网站。
[median],英语(美国):数学公式。输入这个搜索请求的大多数用户想得到关于median这个数学公式的搜索结果。尽管这个搜索请求有明确的核心解读,但没有网页可以专门占有这个搜索请求,所以可能没有核心评分,这个搜索请求的最高评分可能是实用
[guinea pig],英语(美国):一种体型较小的毛茸茸的小动物,经常作为宠物。输入这个搜索请求的大多数用户都要关于这个动物的搜索结果。尽管这个搜索请求有核心解读,但因为没有网站可专门占有这个搜索请求,因此可能没有核心评分。很多网站都有关于这个动物的信息,这个搜索请求的最高评分可能是实用
核心离题或无价值
一般解读:在输入搜索请求的所有用户中,许多或部分用户想要这类结果 [apple],英语(美国):水果。输入搜索请求的部分用户想要关于水果的搜索结果。
[windows],英语(美国):家里镶嵌玻璃的窗户。输入搜索请求的部分用户想要关于房屋玻璃窗户的搜索结果。
[amazon],英语(美国):南美的热带雨林或河流。输入搜索请求的部分用户想要关于河流或热带雨林的搜索结果。
[ada],英语(美国):美国牙科协会(the American Dental Assocaition),美国糖尿病协会(the American Diabetes Association),或者美国残疾人法案(the American with Disabilities Act)。许多或部分用户想要查找以上这些组织的信息。
[mercury],英语(美国):汽车品牌,星球,化学元素。许多或部分用户想要查找关于汽车,星球或化学元素的信息。
[sandals],英语(美国):凉鞋,或者坐落于加勒比海岸的连锁度假村。许多或部分用户想要查找关于凉鞋,连锁度假村的信息。
实用离题或无价值
因为没有主导解读,所以不存在核心页面。
次要解读:在输入搜索请求的所有用户中,只有用户想要这类结果 [ada],英语(美国):亚特兰大发展当局(the Atlanta Development Authority),或者美国投掷者协会(the American Darters Association)。只有少数用户想要这类解读的信息。
[mercury],英语(美国):Mercury杂志(太平洋天文学会发表),或者Mercury唱片(英国的一家唱片公司)。只有少数用户想要这类解读的信息。
[hot dog],英语(美国):“Hot Dog”,一部1984年放映的电影。只有少数用户想要这类解读的信息。
相关离题或无价值
你认为这种解释的可能性越小,你给这个页面评的分就越低。
“不可能”的解读:这种解释的可能性之小,乃至没有人或极少数用户想要这方面的结果。 [guinea pic],英语(美国):来自新几内亚(澳大利亚附近的一个岛国)的猪。可能是在新几内亚的猪,但这种解释的可能性太小,乃至几乎没有用户想要这方面的结果。 离题或无价值

请记住,有主导解读的搜索请求同时*也可能*有一般解读。

搜索请求 主导解读 一般解读
[windows],英语(美国) 微软操作系统 透明的玻璃窗户
[kayak],英语(美国) 旅游网站 小型的,人力驱动的皮船

另外对于多种含义的搜索请求,可能存在多种不同的搜素意图。请判断哪种意图更合理更可能。不太合理或不太可能的搜索意图在评分时需要给以较低评分。

用户意图 示例 评分范围
可能的搜索意图:许多或大多数用户都是这类意图 [tetris],英语(美国):在网上玩tetris(一种视频游戏),或者下载游戏。
[flowers],英语(美国):在线订花,或者了解花的种类,或者寻找花的图片。
[credit cards],英语(美国):寻找信用卡公司,申请信用卡,或者对比不同品牌的信用卡。
[amazon],英语(美国):访问Amazon.com网站。
核心离题或无价值
可能性小的搜索意图:少数用户想要这类意图 [tetris],英语(美国):搜索tetris的历史。
[flowers],英语(美国):寻找单词flower的定义。
[credit cards],英语(美国):阅读关于信用卡历史的文章。
[amazon],英语(美国):阅读关于Amazon.com的百科文章。
相关离题或无价值
评分标准应该是这个页面给多少用户带来了价值。

5.5 搜索请求与着陆页的匹配

许多搜索请求是很宽泛的,也有些特别具体,当然大多数都在两者之间。以下是几个关于搜索请求具体程度的示例:

搜索请求 很具体的搜索请求 更具体的搜索请求
[chair] [dining room chair] [ikea "henriksdal" highback upholstered chair]
[cameras] [Nikon cameras] [Nikon d5000 slr]
[Toyota] [Toyota hybrid] [Toyota Prius 2010]
[library] [Harvard library] [Harvard Anthropology library]
[interview questions] [interview questions for teachers] [practice interview questions used for Teach For America]
[discount stores in hoston] [walmart stores in houston] [walmart 9555 South Post Oak Road houston]

好的着陆页面应该是符合搜索需求的,对搜索用户来说是有帮助的。当着陆页不符合搜索请求时,你需要仔细考虑页面对用户有多大帮助,并给出合适评分。

当着陆页不符合搜索请求时,评分将会很困难。这时应考虑这个页面对用户有多大帮助,并基于此打分。

5.6 常见的评分问题

下面列举了一些评分中常见的问题,大多数是与用户需求,着陆页与搜索请求的匹配程度有关。

5.6.1 字典和百科类结果

字典和百科类页面对想要了解搜索请求的评分人员来说是很有帮助的。这类页面有时候对用来说是很有帮助的,但当用户已经知道了搜索词的含义,正在查找其他信息时,就不那么有帮助了。

评分人员通常给信息型页面很高的评分,尽管搜索请求是事务型搜索。对于很明确的事务型搜索请求,信息型页面的评分应该不高于相关。要考虑用户是想要了解某些事情,还是想做某些事情。查看页面内容,确定页面对信息型搜索或事务型搜索是否有帮助。

请注意产品搜索的信息型需求。很多用户在决定是否购买之前都会在网上搜索相关信息。大多产品搜索都是信息型和事务型搜索。

5.6.2 列表需求类搜索请求

许多搜索请求像是想要一个列表。这里有几个原则可帮助你给这类搜索请求评分:

  • 当搜索请求像是想要一个包含很多事项的列表时,单个事项的页面就不如列表那么游泳。
  • 如果列表包含的事项太少,那单个事项的页面会更有用。
  • 有时会遇到一些著名或流行的单个事项。在这种情况下,著名或流行的单个事项页面会更有用,尽管列表列举了很多事项。

简单说,如果列表中有很少事项,高质量的单个事项页面会更有帮助。如果列表包含很多事项,而单个事项页面太片面,那列表页面通常更有帮助,除非单个事项页面是很著名或很流量的。

5.6.3 拼写错误和输入错误类搜索请求

你会注意到有很多搜索请求都是拼写错误或输入错误。

对于明显的拼写错误或输入错误,你要基于用户需求评分,而不必在乎用户目前的搜索词是怎么拼写,怎么输入。

对于不太明显的拼写错误或输入错误,你应该假设用户正在寻找正如他输入的这个搜索词的相关结果。

对于搜索请求[federal expres],英语(美国),很明显就能判断出用户正在寻找上关于Federal Express的信息——www.fedex.com/us/。对于搜索请求[my sapce],英语(美国),也能确定用户在寻找MySpace——www/myspace.com。对于这些搜索请求没有其他合理的解释、

然后考虑搜索请求[John Stuart],英语(美国)。尽管评分人员感觉用户可能在寻找关于Jon Stewart,著名的喜剧演员以及“每日秀”(一个著名的讽刺新闻的电视节目)的主持人,的相关页面,但我们不能确定这个搜索请求是拼写错误。因为拉斯维加斯秀有个制片人名字叫John Stuart,他的名字与搜索词完全匹配。正好存在与搜索词完全一样的人名,这种情况是很少见的。

重要提示:当一个人或实体与搜索词相匹配时,请不要断定这个搜索词是拼写错误,即使认定为另外一个人很合理。有时,人物是存在的,但在网络上没有结果。

5.6.4 URL搜索请求

许多搜索词看起来像URL,我们称这些搜索为URL搜索。

很多URL搜索是精确的,格式完整的,URL也是有效的,比如[www.ibm.com],英语(美国)。很多URL搜索包含部分URL,比如[ibm.com],英语(美国),如果你在URL前加上"www."或"http://",就会变成有效的URL。我们认为[www.ibm.com],英语(美国)和[htp://www.ibm.com],英语(美国)和[ibm.com],英语(美国)是一样的,这些都可以认为是“URL搜索”。

有些搜索词是网站名称或网页名称,比如[yahoo],英语(美国)或[yahoo],英语(美国)。这些搜索词不包含".com","www"或URL的其他格式。这些都是导航型搜索,因此你不能把他们当做URL搜索。

大多数搜索词既不是URL搜索,也不是网站或网页名称搜索。大多数情况下,搜索词都不包含特定网站或网页的词。

以下是英语(美国)搜索词的一些例子:

URL搜索 网站名称/网页名称搜索
(这些不包含URL元素,属于导航型搜索)
普通搜索
[ebay.ca]
[amazon.com]
[people.com]
[bbc.co.uk]
[www.dealbook.com]
[mail.yahoo.com]
[news google.com]
[tax form 1040 irs.gov]
[rei.com]
[ebay]
[amazon]
[people]
[bbc]
[dealbook]
[yahoo mail]
[google news]
[irs 1040 tax form official page]
[rei kayak page]
[couches]
[diabetes]
[weight loss]
[tax forms]
[quilting]

让我们先讨论下URL搜索。很多URL搜索并不是“有效的URL”搜索。当你将这些URL输入或复制进浏览器地址栏时,这些URL无法正常加载。但是我们相信用户有一个明确的目标页面。我们通常称这类搜索为“不完美的URL搜索”。有很多种不完美的URL搜索,下面是对对部分搜索的说明。

  • 搜索词的格式跟正常URL格式相同,但是页面无法加载。这里有个例子:[www.UnitedStatesPassportProvider.com],英语(美国)。
  • 搜索词的格式跟正常URL格式相同,但明显是拼写错误,而且无法打开。这里有个几个示例:[www.pizzzzahut.com]和[www.mcriosoft.com]。
  • 搜索词跟URL格式类似,但包含多余的单词或空格。这里有个例子:[Australian open tennis tournament.com],英语(美国)。我们称之为“不完美的URL搜索”,因为他包含URL的一部分"tournament.com",但在搜索词中也有空格。
  • 搜索词既有单词又有URL,例如[barbie.com dress up games],英语(美国)。

很多URL搜索极难评分。尽管我们需要访问着陆页面,参考内容评分,但我们仍需要认真查看着陆页的URL以及搜索词中的URL。不要仅依靠表面的URL对URL搜索和页面评分。

试图解读非完美URL搜索的用户意图是很困难的。因为用户很容易就会出现URL输入错误。

如果搜索词是格式完整,有效的URL,请将那个URL作为主导解读。当着陆页URL与搜索的URL完全匹配时,应该给以核心评级。请注意,有时候着陆页的URL会包含比搜索URL更长的字符,或者是另外一种形式。例如,对于[imagehosting.us],英语(美国),http://imagehosting.ushttp://imagehosting.us/index.php?action=show&ident=1478428都应该给以适当的核心评级,因为着陆页面是一样的。

如果搜索词不是完整格式,有效的URL,或者无法加载,请仔细判断并解读用户意图。不要做出核心评级,除非特别确定页面与用户需求完全匹配。

然后让我们谈谈"网站名称"搜索或"网页名称"搜索,这类并不算URL搜索。这些搜索中包含网站名称或网页名称,搜索词的*主导*解读就是这个网站或网页。很多网站名称搜索除了网站名称外还有其他含义。

网站或网页名称搜索 解读
[kayak],英语(美国) 用户可能在查找皮艇(一种船),但是Kayak也是一个很著名的旅游网站。网站kayak.com是主导解读。
[youtube],英语(美国) YouTube是最著名的网站之一。
[ebay],英语(美国) eBay是最著名的网站之一。
[webmd],英语(美国) WebMD是很著名的医药信息网站。
[twitter],英语(美国) Twitter是很著名的网站。
[cafepress],英语(美国) Cafepress是一个用户可以购买T恤和其他礼品,甚至可以定制的网站。
[addicting games],英语(美国) AddictingGames是一个著名的游戏网站。
[rei kayak page],英语(美国) 用户想要达到REI网站上的“kayak”页面。

这里有一些搜索词的例子,这些不是网站类搜索,也不是URL搜索。网站名称与这些搜索词匹配,但这些网站可能不是用户想要的内容。这些搜索并没有核心页面。

通用搜索 解读
[birdcages],英语(美国) 用户可能想要了解或购买鸟笼。这是一个通用型搜索。这里没有**核心**页面。有个商城URL是birdcages.com,但有很多商城都卖鸟笼。
[kamasutra],英语(美国) 用户可能想要了解Kama Sutra或者阅读Kama Sutra的内容。这里没有**核心**页面。有个商城URL是kamasutra.com,但可能不是这个搜索请求的主导解读。
[weightloss],英语(美国) 用户正寻找减肥知识,网络上也有很多关于减肥信息的权威页面。有个网站为weightloss.com,这里有很多关于减肥的有价值信息或者常识,但用户可能并不是想要访问这个页面。
[couches],英语(美国) 用户想要了解couch或购买couch,网络上也有很多卖couch的网站。这里有个网站couches.com,但搜索词并不能表示用户想要访问couches.com这个网站。

请注意,所有的搜索词只要加上“.com”都会变成URL搜索。但是搜索词中没有了“.com”,你不能认定这是一个网站名称。
换句话说,搜索词为[couches]并不意味着搜索结果http://www.couches.com就是用户想要的。请注意这些“通用”搜索词。一种常见的广告作弊技术就是用这些通用名字作为网站域名。
当搜索使用URL搜索词时,意图就是达到某个特定页面。那个目标页面应该评为核心页面。为URL搜索的其他非核心页面评级是比较困难的。有时候,核心页面是URL搜索的惟一一个有帮助的页面。但有时候,其他页面也会很有价值。根据页面内容和搜索词的匹配程度对网页评分,评分范围从离题或无价值实用

5.6.5 新页面和老页面

信息性或知识型搜索可能与最近或过去的事件有关。着陆页面应该根据搜索请求中对信息的需求进行评分。很多搜索请求要求最近才发生的搜索结果。大多数情况下,相对于页面的日期,你更应该考虑页面的内容。
对许多搜索请求来说,时间点是很重要的。最近事件和重复事件的搜索需要最新内容的页面。我们假定寻找选举,体育事件,或其他类型的年度竞赛类结果的用户想要得到最近发生的事件信息,而不是往年的结果。
但是请注意,根据年度事件发生的时间,最有价值的页面可能是过去事件,现在事件,或者即将发生的事件。如果事件是在几个月前发生,最有价值页面可能是关于之前事件的。如果事件将在几个月后举行,最有价值页面可能是关于即将发生的事件。你需要自己去判断。
如果着陆页面是这个事件的官方网页,那将是得到一个核心评分,不管内容是关于过去的还是即将发生的事件。
信息型搜索也会需要最近的结果。例如对于搜索词[population if Paris],英语(美国),用户在寻找最近几年的人口数字。
另一方面,如果搜索请求是[population of France in 1813],那重点就不是这个页面多“新”或多“近”,而是是否有所需要的信息。有时候“旧”页面是一些关于过去事件的唯一的好的资源信息。“旧”页面并不一定是过时的不好的,它依靠搜索请求以及页面的内容。
如果你评分的着陆页是一个搜索引擎页面,并且只有一个空的搜索框,没有任何结果显示,那这个页面就与搜索结果无关,应该给予离题或无价值评级。
如果着陆页面是从搜索引擎来的一系列结果,页面应该是对用户非常有价值的。应该依靠页面给用户带来多大价值,评分范围也从实用离题或无价值

6.0 标记

除了衡量页面质量评分外,你还需要对特殊类型的页面进行标记。

6.1 广告标记

你需要寻找页面上的广告信号(你可以在网络广告指南,通用指南的第部分学到这方面知识)来决定页面是否需要加上广告标记。
不是广告:如果你认为页面没有使用任何欺诈网页设计技术,你需要做一个不是广告标记。
可能是广告:如果你发现网页有广告迹象,但你又不确定站长使用了欺诈网页设计技术,那你应该标记为可能是广告
广告:如果你确定网页使用了网络广告指南里的欺诈网页设计技术,那你应该标记为广告
如果你选择了可能是广告或者广告,你应该备注下原因。

6.2 色情标记

请使用色情标记所有的色情网页。如果页面有色情内容(包含色情图片,链接,文字,弹窗或者广告),那就应该认为是色情页面。图片应该依靠当前地区的文化来判断是否为色情,而不是其他地区。请使用你的判断,以及任务区域的常识来判断。

6.2.1 明显的色情意图

如果用户的搜索请求明显不包含色情意图,那关于搜索词的色情内容页面和主题内容中包含色情内容的页面都应该评为离题或无价值,并且页面标记为色情。例如对于搜索请求[car pictures],在任何任务语言下,页面如果有一张裸体女人依靠在车上的图片,应该被评为离题或无价值,并标记为色情,尽管确实图片里确实有一辆车。
我们要求这样做的原因有以下两点:

  • 如果用户意图明显没有色情内容,那没有任何关系的色情页面,或者主题内容中含有色情内容的页面,应该是没有任何实用性的。
  • 突然出现的色情内容对大多数用户来说是一种很差的体验,是搜索引擎低质量的表现。

6.2.2 可能的色情意图

很多搜索请求都有色情和无色情两种解读,例如,所有下面的英语(美国)搜索请求都可能有色情意图,但他们也有无色情的意图:[girls], [gay], [thong], [breast], [sex], [spanking]。我们称这些搜索请求为“可能的色情意图”的搜索请求。
对这些搜索请求来说,请假定无色情解读是主导,尽管有时候你认为用户是在寻找色情内容。例如,请假定[spanking],英语(美国)的主导解读是父母对小孩的惩罚原则。将色情解读作为次要解读,尽管你认为大多数用户在寻找色情内容。

6.2.3 明显的色情意图

当搜索请求明显是色情意图,并且没有其他意图时,请使用评分度量为这些色情页面评分,而且不要给太低的分数。尽管是有色情意图,但页面仍需要标记为色情
请注意,你不需要简单的为色情页面评分为相关实用。尽管搜索请求有色情意图,搜索结果也是色情内容,页面应该是符合搜索请求具有一定的实用性,应该得到很高的评分。
而那些尝试下载恶意软件的网站则有很差的用户体验,应该得到较低的评分,尽管这些页面有一些图片符合搜索请求。
色情明星,色情电影,著名色情网站的名字等都会有核心页面。请坚持为所有的色情页面做色情标记,尽管有些是核心评分。
请不要因为搜索请求有色情内容,就为一些非色情页面打上色情标记。如果着陆页面没有色情内容,就不应该被标记。

6.3 恶意标记

一个网页应该打上恶意标记,有以下情况:

  • 浏览页面时你被迫退出浏览器,因为提示一直后退,不能离开。
  • 浏览页面时企图下载恶意软件,木马,病毒等。

请注意,可以关闭的弹窗不算是恶意软件,尽管需要花费很多精力去关闭。
请不要仅因为浏览器出现提示信息或收到身份验证请求就标记为恶意。仅当以上列出的两种情况下,才可以作恶意标记。如果你遇到一个页面出现警告信息,例如“警告 - 访问这个网站可能危害你的电脑”,或者你的杀毒软件发出警告,你不必访问页面进行打分。你需要将这些页面标记为未分级: 无法加载

6.4 评分与标记间的兼容

请注意,未评级页面也可以打上广告色情恶意标记。
以下是几个例子:

  • 页面是外语,但有色情图片。
  • 页面是外语,但有隐藏文字。
  • 页面无法加载,但你可以从URL中看出有欺诈跳转。你可以在网络广告指南(通用指南的第四部分)学到欺诈跳转。
  • 页面无法加载,但有色情广告。
  • 页面是外语,但你无法关闭弹窗广告,你被迫关闭浏览器。

第二部分: 有搜索词区域的URL评分任务

1.0 搜索词区域

所有的URL评分任务都有一个任务区域,这个区域通常是国家。

许多URL评分任务也有一个搜索词区域,这个区域通常跟搜索者在搜索时的地理位置有关。这个搜索词区域可能是邮编,城市,城市和州等等。通常,搜索词区域是被搜索引擎自动识别得到,但都是来自用户所述的属性。

对一些已经定义好的较局限的搜索词区域来说,例如邮政编码或城市,相关内容的区域可能超出这些指定的邮政编码或城市范围。请记住,真实的用户经常会寻找最近的商店或饭店。如果这些内容超出了指定区域,用户也可能接受的。面对这类问题,你需要仔细考虑判断是否合理。

要了解有搜索词区域的任务,你需要了解以下几个重要事情:

  • 你需要处于在搜索词区域的用户的角度去评分。
  • 当地页面(与搜索词区域相关的页面)更有帮助,也应收到更高评分。
  • 部分页面对任意搜索词区域的用户都有价值,也应当给与高评分。
  • 当搜索词是一个实体,如一个业务,组织,学校等,而且这个实体既有官方网站又有当地的官方网站,那实体的官方网站和对应地区的官方网站都应该给与**核心**评分。

重要:有时候用户在输入搜索词的时候会指定一个区域。例如,搜索词[pizza hut, Marietta,Georgia],用户指定了"Marietta, Georgia"作为感兴趣的区域。许多评分任务既有搜索区域,又在搜索词中指定区域。当遇到这种情况,你应该更多的考虑搜索词中的区域,而不是搜索区域。

以下是三种搜索任务的示例:

  • 搜索词中指定区域的任务
  • 有搜索区域的任务
  • 既有搜索区域,在搜索词中又指定区域的任务
任务类型 截图 描述
这个任务并没有指定区域,因为并没有搜索区域。
但是,请注意,在搜索词中指定了区域。
用户想要San Francisco区域的Pizza Hut信息。
这是个区域指定任务,因为他有个搜索词区域。 这个搜索假设是由居住在San Francisco的用户搜索。
我们可以假设用户在查找San Francisco的Pizza Hut的餐馆。
这也是一个区域指定任务,因为他有个搜索词区域。 假设是由居住在纽约的用户搜索。
但是,因为搜索词中包含“san francisco”,我们知道用户是在搜索San Francisco区域的餐馆,尽管搜索区域是纽约。

2.0 指定区域评分任务截图

指定区域URL评分任务页面与标准的URL评分任务页面相似,除了他显示了跟搜索区域相关的附加信息。

指定区域的评分任务截图

3.0 有搜索词区域时进行评分

在一些搜索任务中,搜索词区域将会是评分时需要考虑的重要因素。例如:

Query:[IHOP restaurants],英语(美国)
Query Location:Boston,MA
搜索词区域是个重要因素。Boston输入搜索词的用户对Boston区域的IHOP餐馆很感兴趣,并不是其他区域。

但是,在部分搜索任务中,搜索词跟指定区域无关。搜索词区域也不需考虑。在这种情况下,页面评分应该与没有搜索词区域下的评分完全一样。例如:
Query:[amazon.com],英语(美国)
Query Location:Boston,MA
搜索词区域是不需要考虑的。Amazon.com是一个跟搜索词区域无关的网站。

搜索词区域经常产生这种差异:在某些区域的着陆页面相当于其他区域来说,对用户更有帮助。

3.1

【未完待续】

Comments
Write a Comment