STAKE中国官方网站看法
SEO个性化网页权重研究
宣布时间:2008-10-30
个性化网页权重的常见形式就是个性化PageRank。。。。。。。现代搜索引擎对自然搜索引擎排名的排序依据除了使用古板的文本匹配手艺以外,,,,,,,,也普遍地使用网页权重值来举行。。。。。。。
个性化网页权重的常见形式就是个性化PageRank。。。。。。。现代搜索引擎对自然搜索引擎排名的排序依据除了使用古板的文本匹配手艺以外,,,,,,,,也普遍地使用网页权重值来举行。。。。。。。最为著名的例子就是Google的PageRank手艺。。。。。。。使用web结构的链接关系,,,,,,,,PageRank可以盘算每个网页的权重值,,,,,,,,并据此对效果网页举行排序。。。。。。。因此,,,,,,,,若是使用用户的偏好信息来修改PageRank权重值的盘算,,,,,,,,据此就爆发表达特定用户个性化信息需求的搜索引擎排序效果。。。。。。。从效果上看,,,,,,,,这种要领较PageRank更为适用,,,,,,,,由于事适用户是不可能所有遍历获取的盘问网页效果荟萃,,,,,,,,以是把和用户需求联系最为亲近的网页放于搜索效果前面,,,,,,,,一定更易于用户会见。。。。。。。着实,,,,,,,,Page等早已提出个性化PageRank的设想,,,,,,,,只是他们并没有在此项研究上深人地开展下去基于个性化网页权重的个性化搜索引擎模子。。。。。。。
现在,,,,,,,,人们提出的个性化PageRank要领有许多,,,,,,,,主要分为两大类:一类是直接修改基于超链关系获得的网页权重值;;;;;;;;另一类是在古板PageRank公式上添加修正参数来反应用户的个性化要求。。。。。。。
在原先的PageRank盘算公式中,,,,,,,,模子对每个网页的链接分派了相同的概率值,,,,,,,,以是这种要领给差别链接和网页分派的权重是一样的,,,,,,,,目今网页的权重值也会平均地影响链出网页,,,,,,,,同时它还假设用户随机跳转到其他任何网页的概率都是一样的。。。。。。。以是,,,,,,,,这种盘算要领主要是依赖于网页结构图中的链接来举行剖析。。。。。。。可是,,,,,,,,这些链接却是由网站的网页设计者天生的,,,,,,,,因此它只能反应设计者对Web中其他网页的明确。。。。。。。另外,,,,,,,,这种要领忽略了另外一个主要方面,,,,,,,,那就是Web用户对Web网页的明确。。。。。。。也就是说,,,,,,,,纯粹使用网页之间的超链结构来表达网页权重值是不充分的。。。。。。。较量简朴易行的修改网页权重做法就是使用Web日志挖掘信息来获取用户对Web网页的明确水平,,,,,,,,以完善古板的PageRank盘算方法。。。。。。。事实上,,,,,,,,凭直觉可以判断出来,,,,,,,,那些会见频率较高的超链应该比那些会见频率较低的超链更为主要,,,,,,,,然而大部分的古板超链剖析手艺对这两者并不加以区分。。。。。。。
关于团结使用信息的超链剖析手艺最初是由Zhu等提出的,,,,,,,,他们把相关公式称为PageRate,,,,,,,,虽然他们也宣称自己的算法是PageRank的扩展,,,,,,,,可是着实这种算法不具有任何PageRank的性子。。。。。。。这种算法对所有的链入不加区分,,,,,,,,并不思量高频会见和低频会见的区别。。。。。。。同时,,,,,,,,他们也没有给出实验结论,,,,,,,,对可能保存的问题也没有探讨,,,,,,,,设计的公式还保存问题。。。。。。。
有些其他方面的研究也涉及使用信息剖析。。。。。。。例如,,,,,,,,使用一种增强学习要领来对搜索效果举行重排序和过滤,,,,,,,,关于每个盘问效果中的URL,,,,,,,,系统都会纪录差别用户的点击情形。。。。。。。在随后的盘问中,,,,,,,,上述信息就可以有用地提升高频会见的URL权值,,,,,,,,而降低低频会见的URL权值这样的类似要领还应用于一些商业搜索引擎中,,,,,,,,若有的学者就在多元搜索引擎中使用上述要领实现一种隐式的相关度反响机制,,,,,,,,它将用户点击爆发的使用情形主要用于效果网页合并和网页重排序等操作中旧。。。。。。。用户使用信息还应用于基于模式的应用程序中,,,,,,,,主要功效是实时学习用户的兴趣,,,,,,,,并对搜索效果重排序以反应这种用户兴趣,,,,,,,,如凭证用户模式的特征改变差别主题词的相对主要水平。。。。。。。
较量好的要领是使用挖掘Web日志中的信息团结古板PageRank公式得出一种新的网页权重盘算公式,,,,,,,,即团结使用挖掘的PageRank,,,,,,,,如特征敏感的PageRank(usage aware PageRank,,,,,,,,UPR)。。。。。。。它团结了静态链接结构剖析和用户使用剖析两项手艺:一方面仍然强调古板网页间的超链关系;;;;;;;;另一方面,,,,,,,,它通太过析日志,,,,,,,,判断这些现实保存的网页超链中事实哪些是经常被用户会见的,,,,,,,,哪些不是经常被用户会见的,,,,,,,,并以此来刷新古板要领中由超链关系爆发的网页权重值。。。。。。。在UPR要领中,,,,,,,,甚至还可以通过调解参数设置来控制静态链接结构剖析手艺和Web使用挖掘手艺的作用力度,,,,,,,,若是参数设置为O,,,,,,,,公式就等价于古板的PageRank公式,,,,,,,,若是参数设置为1,,,,,,,,则重点就转移到使用挖掘剖析算法上,,,,,,,,介于两者之间则会兼顾,,,,,,,,因此这种方法较古板方法更为归纳综合。。。。。。。从效率上看,,,,,,,,这种算法也有优势,,,,,,,,只需通过一次特另外预处置惩罚办法,,,,,,,,其他的迭代处置惩罚和古板方法没有区别。。。。。。。
然而这种新的要领也保存缺乏之处。。。。。。。纵然网站管理员可以获得自己站点用户的会见信息,,,,,,,,并将其应用于UPR剖析,,,,,,,,可是这些信息显然没有包括所有的须要信息,,,,,,,,如管理员不可能获得不属于自己站点会见内的链出网页使用情形。。。。。。。虽然可以通过爬虫程序遍历那些网页的超链结构,,,,,,,,可是除了可以获得用户通过哪些网页的链出网页会见外地网页的使用信息,,,,,,,,并不可能获得其他更为主要的使用信息。。。。。。。也就是说,,,,,,,,从站点条理上看,,,,,,,,所有的结构信息和使用信息是可以所有获取的,,,,,,,,然而从整个Web网络条理上看,,,,,,,,却是不完整的。。。。。。。同时,,,,,,,,对简单的应用手艺而言,,,,,,,,整个Web网络上的用户使用信息也是无法完整获取的。。。。。。。诸如Google搜索工具栏等客户端应用程序,,,,,,,,虽然它们可以网络用户的使用信息,,,,,,,,并且这些信息也确实是基于整个web规模而言的,,,,,,,,然而这里所涉及的用户规模是相当小的,,,,,,,,他们首先必需装置客户端应用程序,,,,,,,,并且必需举行相关设置以赞效果真这些属于小我私家隐私的Web会见信息。。。。。。。需要说明的是,,,,,,,,诸如Google搜索工具栏之类的软件在默认情形下是尊重用户的小我私家隐私权的,,,,,,,,除非用户自己允许,,,,,,,,它并不自动网络任何用户会见的信息,,,,,,,,虽然也有其他一些客户端应用程序似乎并不遵守上述原则。。。。。。。
因此,,,,,,,,这种团结使用挖掘的PageRank最适用于网站内部的网页搜索,,,,,,,,搜索引擎事情的原理先获取该网站的结构信息,,,,,,,,结适用户使用信息,,,,,,,,可以获得古板PageRank要领的扩展模子。。。。。。。实验效果也能证实这种算法更能有用地提升高会见频率的网页权重值,,,,,,,,响应地降低那些低会见频率的网页权重值。。。。。。。
随着搜索引擎手艺逐步走向成熟,,,,,,,,越来越多的搜索引擎优化事情者以及很难从搜索引擎的表象去研究SEO。。。。。。。近一年时间以来,,,,,,,,Google、百度等搜索引擎一直调解链接剖析手艺,,,,,,,,加深SEO门槛。。。。。。。SEOER也必需随着搜索引擎的生长而生长。。。。。。。
上一篇:SEO个性化网页权重研究之二
下一篇:现在个性化搜索的缺乏点
相关内容NEW
24小时免费服务咨询热线:400-080-3010
连忙咨询
联系STAKE中国官方网站






连忙咨询
联系STAKE中国官方网站