我在这里: 宁波SEO首页 » SEO技术 » 网页相似度的计算方式分析
« 站内SEO的实施方法以及策略分析404错误页面对搜索引擎的影响 »

网页相似度的计算方式分析

网页相似度通俗点来说,就是重复内容,但不等于全是重复内容,另外还包括网站结构重复,搜索引擎向来不喜欢重复的内容,包括页面相似,结构相似的,最坏的情况是,它可能会将该站点视为垃圾站点。Google 对网页相似度限制在60%,如果超过这个标准将导致页面不被收录,或者收录后排名靠后中,如果相似度达80%以上,将可能受到惩罚。页面相似度太高将导致页面收录有问题。

网页相似度 

网页相似度是比较网页是否相似,通常有以下两种计算方式:

  • 根据网页摘要来比较,如果多个网页摘要的md5值一样,证明这些网页有很高的相似性
  • 根据网页出现关键词,按照词频排序,可以取N 个词频高的,如果md5值一样,证明这些网页有很高的相似性。

网页相似度对SEO 的影响是很大的,我们可以利用检测工具来检测,网页相似度检测工具是用来测量两个网页内容的相似程度,当两个网页的相似度在60%以上时,很有可能被搜索引擎尤其是google判断为抄袭页面或复制页面,从而不被收录或降权,删除相似页面等措施。为了防止网页相似度太高,对网页进行相似度检测是非常必要的。(检测工具:http://www.webconfs.com/similar-page-checker.php

网页相似度检测

输入第一个网页网址

输入第二个网页网址

【原文归:宁波网站优化中心,宁波SEO研究中心所有,转载请注明出处:http://www.ningboseo.com/SEO-Technology/similar-page.html

  • 相关文章

发表评论

为了防止SPAM,含链接的评论需要审核后才能显示。

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。