网页相似度通俗点来说,就是重复内容,但不等于全是重复内容,另外还包括网站结构重复,搜索引擎向来不喜欢重复的内容,包括页面相似,结构相似的,最坏的情况是,它可能会将该站点视为垃圾站点。Google 对网页相似度限制在60%,如果超过这个标准将导致页面不被收录,或者收录后排名靠后中,如果相似度达80%以上,将可能受到惩罚。页面相似度太高将导致页面收录有问题。
网页相似度是比较网页是否相似,通常有以下两种计算方式:
- 根据网页摘要来比较,如果多个网页摘要的md5值一样,证明这些网页有很高的相似性
- 根据网页出现关键词,按照词频排序,可以取N 个词频高的,如果md5值一样,证明这些网页有很高的相似性。
网页相似度对SEO 的影响是很大的,我们可以利用检测工具来检测,网页相似度检测工具是用来测量两个网页内容的相似程度,当两个网页的相似度在60%以上时,很有可能被搜索引擎尤其是google判断为抄袭页面或复制页面,从而不被收录或降权,删除相似页面等措施。为了防止网页相似度太高,对网页进行相似度检测是非常必要的。(检测工具:http://www.webconfs.com/similar-page-checker.php)
【原文归:宁波网站优化中心,宁波SEO研究中心所有,转载请注明出处:http://www.ningboseo.com/SEO-Technology/similar-page.html】












