影响搜索效果排序的因素
上面的内容好象有些深奥,由于涉及大量手艺细节,我们只能说到这儿了。那下面我们说说人人最感兴趣的排序问题吧。用户输入关键词进行检索,百度搜索引擎在排序环节要做两方面的事情,第一是把相关的网页从索引库中提取出来,第二是把提取出来的网页根据差异维度的得分进行综合排序。“差异维度”包罗:
1,相关性:网页内容与用户检索需求的匹配水平,好比网页包罗的用户检查关键词的个数,以及这些关键词泛起的位置;外部网页指向该页面所用的锚文本等
2,权威性:用户喜欢有一定权威性网站提供的内容,响应的,百度搜索引擎也更信托优质权威站点提供的内容。
3,时效性:时效性效果指的是新泛起的网页,且网页内承载了新鲜的内容。现在时效性效果在搜索引擎中日趋主要。
4,主要性:网页内容与用户检查需求匹配的主要水平或受迎接水平
5,厚实度:厚实度看似简朴却是一个笼罩局限异常广的命题。可以明白为网页内容厚实,可以完全知足用户需求;不仅可以知足用户单一需求,还可以知足用户的延展需求。
6,受迎接水平:指该网页是不是受迎接。
以上即是百度搜索引擎决议搜索效果排序时思考的六大原则,那么六大原则的偏重点是怎样的呢?哪个原则在现实应用时占比最大呢?其着实这里没有一个确切的谜底。在百度搜索引擎早期,这些阈值简直是相对牢靠的,好比“相关性”在整体排序中的重量可以占到七成。但随着互联网的不停生长,检索手艺的提高,网页数目的发作式增进,相关性已经不是难题。于是百度搜索引擎引入了机械学习机制,让程序自动产出盘算公式,推进排序战略加倍合理。