我正在寻找能够展示单个网页重要性的算法/技术.抛开PageRank,还有其他方法可以根据内容,结构和超链接进行相应的评级吗?
我不只是在谈论从www.foo.com到www.bar.com的连接,如PageRank,还有www.foo.com/bar到www.foo.com/baz等等(除此之外)根据这些需求调整PageRank)
我如何“定义”重要性:在这种情况下,我认为“这一方面对用户的重要性,以及对网站其他部分的重要性”.
例如.在首页上宣布了一个圣诞节抽奖活动,只有一个链接通往该网站对用户和网站更为重要.一个印记,其中包含来自每个站点的链接(因为它主要位于页脚中的某个位置)并不重要,尽管它有许多链接.版本记录对于作为“单位”的网站来说也不重要,因为它没有为页面的作用提供任何实际价值(=提供信息,销售产品,一般服务等)
最佳答案 还有
SALSA比HITS更稳定[因此它受垃圾邮件的影响更小].
由于您也对页面的上下文感兴趣,您可能想看看Haveliwala在topic sensitive page rank上的工作