STAKE中国官方网站

STAKE中国官方网站看法

搜索引擎的排序和算法

宣布时间:2009-02-23

怎样在检索效果提供时,,,,,,将最切合检索要求的资源在排列中靠前,,,,,,成为提高检准率的主要手段。。。。。

搜索引擎的一个突出问题是,,,,,,要害词搜索返回的网络资源数目过多,,,,,,用户很难完整地浏览,,,,,,研究发明,,,,,,大都通俗用户在检索时,,,,,,只浏览前一、两页的网络资源。。。。。因此怎样在检索效果提供时,,,,,,将最切合检索要求的资源在排列中靠前,,,,,,成为提高检准率的主要手段。。。。。针对这一情形,,,,,,网络要害词搜索系统的搜索效果提供,,,,,,一样平常都接纳按匹配加权的方法加以排序显示,,,,,,即在返回所有搜索效果的同时,,,,,,凭证与搜索需求的切合水平排序显示,,,,,,以便将最切适用户需求的资源在前面显示,,,,,,在坚持检全率的同时提高检准率。。。。。

由于这一缘故原由,,,,,,自从主题搜索引擎使用以来,,,,,,好的搜索排序计划成为反应搜索引擎质量的要害因素之一。。。。。差别的系统往往接纳差别的排序提供战略,,,,,,著名搜索引擎如Google多年来被一些机构评为最佳搜索引擎,,,,,,其率先提出PageRank算法,,,,,,优化了搜索排序的效果,,,,,,是一个主要的因素。。。。。凭证现在能见到的资料,,,,,,种种搜索引擎用来确定网络资源排序依据的因素,,,,,,基本上涉及两个方面,,,,,,其一是相关性因素,,,,,,即确定其内容是否切合搜索提问;;; ;;;其二则是主要性因素,,,,,,即判断该资源自己是否有价值。。。。。从现实使用情形看,,,,,,现在接纳作为排序依据的加权计划涉及的因素通常包括:

1.词频。。。。。即将搜索要害词的匹配词频作为排序显示的一个因素。。。。。搜索要害词词的匹配数目是资源相关性的一个基本因素。。。。。在这类算法中,,,,,,反文献频率往往被作为一个因素纳入权值盘算的规模。。。。。

2.词汇一致度。。。。。在使用多个词举行搜索匹配时,,,,,,通常需要凭证差别词汇的匹配度分派权值,,,,,,如,,,,,,文本与搜索式中的词是所有匹配照旧部分匹配,,,,,,文本检索词的词序与搜索式的序次是否一致以及搜索词的距离因素等,,,,,,均可以凭证情形确定响应的权值。。。。。

3.词位因素。。。。。即凭证匹配词泛起位置的主要水平给予差别的权值,,,,,,古板数据库系统中通常将问题要害词文摘小问题首段尾段段落的首句一样平常的正文等付与差别的权值,,,,,,在网络搜索中,,,,,,一样平常凭证网络文本的特点,,,,,,对问题、黑体字、URL等的词划分给予特定的权值。。。。。

4.链接因素。。。。。凭证链接的情形付与响应权值,,,,,,作为排序的依据。。。。。较量典范的如(Google凭证PageRank算法,,,,,,将链接数目以及链接工具的主要水平作为排序依据;;; ;;;Teoma则接纳凭证统一专业领域网站(Community)的链接情形作为主要性依据的排列战略。。。。。

5.点击因素。。。。。即凭证用户使用情形,,,,,,将使用频率较高的搜索工具付与响应权值,,,,,,提前排列。。。。。如HotBot接纳Direct Hit手艺,,,,,,对用户的搜索效果集举行剖析,,,,,,凭证会见网站的用户的数目和用户在网站平均停留时间来判断哪些网站是“受欢迎的网站”,,,,,,然后对检索效果举行重新排序,,,,,,提高那些切合检索要求而又“受欢迎的网站”在效果集中的排名,,,,,,响应降低不受用户关注网站的排名。。。。。

6.扫除商业因素。。。。。如,,,,,,某些系统若发明搜索工具与人为增添搜索要素的商业公司网站有联系,,,,,,则不予排列,,,,,,以坚持系统排列的客观性。。。。。

上一篇:搜索战略

下一篇:文章页面优化的技巧

tel 24小时免费服务咨询热线:400-080-3010

连忙咨询连忙咨询 联系STAKE中国官方网站联系STAKE中国官方网站
【网站地图】【sitemap】