来源: http://www.haizr.cn | 时间:2019.04.28 | 浏览数:43
HITS 算法是由康奈尔大学( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登研究中心( IBM Almaden Research Center) 的名为“CLEVER”的研究项目中的一部分。
按照HITS算法,用户输入关键词后,算法对返回的匹配页面计算两种值,一种是枢纽值(Hub Scores),另一种是权威值(Authority Scores),这两种值是互相依存、互相影响的。所谓枢纽值,指的是页面上所有导出链接指向页面的权威值之和。权威值是指所有导入链接所在的页面中枢纽之和。
一个网页重要性的分析的算法。通常HITS算法是作用在一定范围的,比如一个以程序开发为主题网页,指向另一个以程序开发为主题的网页,则另一个网页的重要性就可能比较高,但是指向另一个购物类的网页则不一定。
在限定范围之后根据网页的出度和入度建立一个矩阵,通过矩阵的迭代运算和定义收敛的阈值不断对两个向量Authority和Hub值进行更新直至收敛。
HITS算法的最大缺点:
它在查询阶段进行计算,而不是在抓取或预处理阶段
所以HITS算法是以牺牲查询排名响应时间为代价的
也正因为如此原始HITS算法在搜索引擎中并不常用
不过HITS算法的思想是进入到了搜索引擎的索引阶段
也就是根据链接关系找出具有枢纽特征或权威特征的页面
成为权威页面是优先考虑的,不过难度比较大
唯一的方法就是获得高质量链接
当你的网站不能成为权威页面时就让它成为枢纽页面
所以导出链接也是当前搜索引擎排名因素之一
上一篇: 百度搜索落地页时间因子规范是什么