**网页搜索Query-Url质量评估标准

  什么是query-url质量评估

  本文说的query-url质量评估,核心是根据query需求,衡量搜索结果(即一个url页面)的好坏。评估的标准是看搜索结果是否能提供用户想找的信息,满足了用户的需求,以及在多大程度上满足了用户的需求。这里面包含两个层次:

  (1)搜索结果是否可以提供用户想找的信息。如果结果正是用户所找,可以满足用户需求,则是好结果;如果结果里没有用户想要的信息,没有用户关心的内容,则是差结果。

  (2)多大程度上满足了用户的需求。在能满足用户需求的前提下,用户获取信息越丰富、全面、权威越好;成本越低越好,成本包括花费的时间、操作的步骤、用户需要的信息是否可以明显的展现出来等。

  搜索质量评估的目的

  百度的使命是“让人们最便捷地获取信息,找到所求”,目标是最大程度的满足用户需求,不断完善搜索质量,提升用户体验。

  Query-url质量评估是提升搜索质量的一个基础且核心步骤,我们需要通过评估来发现目前的缺陷,从而提高搜索质量。搜索质量评估工作的成果,将影响到包括您在内的数亿百度用户的搜索体验。

  常用术语解释

  为了便于理解本文档, 对一些常用的名词术语等进行如下说明:

  *   Query

  也可称查询词、关键词、搜索词,指用户输入到搜索框想要查找的字、词、符号等。以后作为Query出现的词,一般都会用“【”、“】”括起来。

  *   Term

  即组成一个query的字、词,如query【新浪微博】,拆开后的“新浪”、“微博”,我们称为Term。

  *   用户需求/用户需求意图

  简称“需求”,对于用户来说,来到搜索引擎是带着目的来的,他们键入搜索词是希望获得相应的满足,比如获得相应的信息、网上购物等,我们把用户query背后的这种诉求称为用户需求。    

  如搜索【新浪微博】,用户需求是找站点http://t.sina.com.cn/,进入微博查看信息、发微博等;搜【如何减肥】,是想减肥,找减肥的方法产品活动等。我们把用户输入的“query”背后表达的意图称为“用户需求”。

  *   搜索结果

  指搜索引擎(如百度、google等)根据Query返回的搜索结果,可以指具体某一条Url页面,也可以指所有的搜索结果。

  *   URL

  也称为网页地址,简称网址。百度主页页面的url是“http://www.baidu.com/”。本文用url指就是我们需要评估的一个页面,但是需要注意,我们要评估的是这个url页面载入后这个页面上所提供的内容,而不是url本身。所以query-url评估打分,即根据query,对该url页面的打分。

  *   网站主页

  我们也将网站的主页面称为网站首页,这是我们登入、浏览该网站时最先看到的主要页面。网站主页的url往往以.com\.edu\.org\.gov等结尾,如http://www.apple.com/就是苹果电脑公司的网站主页,新浪网站的主页为http://www.sina.com.cn/,又例如http://www.mcdonalds.com/是麦当劳的网站主页。

  *   网站子页面

  网站中凡是非主页的页面,我们都称之为该网站的子页面。比如说http://www.apple.com/iphone/ 就是苹果公司网站的一个子页面,又例如麦当劳的一个子页面为: http://www.mcdonalds.com/usa/rest_locator.html。

  *   主题

  也称为query表意,一个query的主题即query表达的意思是什么,用户输入一个query是想在搜索引擎中找到与该query主题相关的网页等内容。

  *   页面内容

  在页面上,广告、赞助商链接等不作为页面内容来进行评估,我们需要评估的是页面的主体信息,如站长发布的内容,即网页自身上所能提供的信息,评分时不应该根据广告来进行评估,即使某些广告可能看上去是相关的。

  *   需求满足度

  也称需求满足、满足程度,即一个url页面对用户需求满足有多大帮助和价值的衡量,满足程度高的页面对用户非常有帮助,反之满足程度低的页面对用户价值很低。需求满足是衡量搜索引擎质量的最重要因素,是在评估打分中需要重点考虑的。

  *   有效性

  在评估网页时,资源有效性是非常重要的评估要素,如视频是否能播放、软件是否能下载。一个资源有效高质量网页才能满足用户的需求,一个实际失效的网页,对于用户来说是没用的。

    

相关文档:百度网页搜索Query-Url质量评估标准(完整版).doc