1. 首页
  2. seo技术

浅析词频位置加权排序算法

词频位置加权排序算法:是一种通过关键词出现的位置和频率进行排序的方法,它是搜索引擎最基础的排序算法之一。当用户通过关键词进行搜索时,当某一个网页中该关键词出现的次数越多,位置越重要,则认为该网页更加符合用户的需求。早期大量的搜索引擎(如:Infoseek,Nutch,Excite,Lycos等)都基于该算法进行网页检索排序,当然在差别的搜索引擎中具体的排序方法有所差别。词频位置排序原理该算法以一个

  高频词部位权重计算排序算法:是一种根据关键字产生的具体位置和頻率开展排列的方式,它是百度搜索引擎最根本的排序算法之一。当客户根据关键字开展检索时,当某一个网页页面中该关键字产生的频率越多,部位越关键,则觉得该网页页面更为合乎客户的要求。初期很多的百度搜索引擎(如:Infoseek,Nutch,Excite,Lycos等)都根据该优化算法开展网页页面查找排列,自然在区别的各大搜索引擎中主要的排序算法有一定的区别。

  高频词部位排列基本原理

  该优化算法以一个搜索关键词与网页页面的相关性尺寸作为排列限度,而搜索关键词在网页页面中的相关性则由它在网页页面中产生的频次和部位两层面加权计算获得。在这个优化算法边上,词对页面的关联性与词在该网页页面中的权重值正相关。

  根据高频词和部位权重计算,可以得到关键字对页面的权重值。当客户检索该关键字,百度搜索引擎依据搜索词在区别网页页面的相关性排列,这就是高频词部位权重计算排序算法。

  高频词权重计算的方式

  高频词权重计算的方式 有肯定高频词权重计算、相对性高频词权重计算、反高频词权重计算、根据词辨别值权重计算这些。

  针对单一词百度搜索引擎、简易查找要求,仅用纯粹地估算一个词在网页页面中的发生頻率就可给出权重值;而针对具备开展多种逻辑性作用的百度搜索引擎,则必不可少综合性其他的权重计算排序算法。由于用多种逻辑性检索式查找时,检索結果跟检索式中的每一个搜索关键词有关,而每一个搜索关键词在任何的网页页面中产生的总頻率是不一样的,假如依据总的权重值来排列,便会造成最后的不有关。此刻就可以运用相对性高频词权重计算基本原理来处理:根据对很多网页页面的统计分析,把越发在所有网站中发生頻率高的词给与一个较低的默认值;相对性地,在所有网站中发生頻率低的词,给一个较高的权重值

  部位权重计算方式

  部位权重计算主要是根据对词在网页页面中区别部位和样式,给与区别的权重值,进而依照权重值来明确所查找的效果和搜索关键词的有关水平。

  词的部位包含:网页页面文章标题、网页页面叙述,关键词、文章正文文章标题、文章正文內容、文字连接、alt标志等。

  样式包含:字体样式、字体大小、有没有字体加粗注重等。和传统式参考文献一样,一般在较关键的部位如文章标题、文章正文的末尾句等发生的词给比较大的权重值。在理想情况下,这种差异的标识相匹配的內容在表述网页页面主题风格的水平上有一定的差别。通常标识符比较大、字体加粗注重的地区,一般也会提供更高的权重值

  完成步伐

  该排序算法的完成基本上步伐是:收集网页页面,分析网页页面,过虑停用词,获得关键字(汉语全自动切词),依照关键字的具体位置和次数权重计算得到词对页面的相关性,客户查找时依据关键字在网页页面中的权重值尺寸对该网页页面开展排列。

  高频词部位优化算法点评

  优势

  运用高频词和部位权重计算优化算法是在传统式的文本文档查找基础理论和技术性基本上发展壮大而成的,具备简易、易完成的优势,是百度搜索引擎初期排列的关键观念,技术性发展趋势最完善。

  缺陷

  词频统计比较适用合理布局化文本文档数据信息,殊不知互联网时代的关键参考文献是以网页页面的方式出现的。优化算法只是依照高频词和位置信息排列,压根沒有充分利用网络中HTML文件的新特点,可以说成前互联网时代的技术性。

  如今几乎所有人都可以自由地在网络上授予各种各样內容,高频词同样的2个网页页面,品质相距可以很远,难以检修口文本文档的布置和文件的品质。

  很多SEO网页页面的创作者煞费苦心,在其网页页面上堆积关键字,特别是在至关重要的部位(尤其是)中置放主题风格不相干的关键词。当消费者在打开网页时彻底看不见,而在百度搜索引擎爬取时,却能发觉。对于此事百度搜索引擎也探究出各种各样方式来,发觉和处罚(黑帽SEO)这类舞弊个人行为。

  汇总:如今的百度搜索引擎开发设计了更为科学合理的链接分析优化算法,可是假如纯粹借助链接分析,很有可能会产生主题风格飘移的问题。造成即使网页页面的品质再高,再权威性,假如搜索关键词和网页页面的相关性不高,针对客户而言也是没有用的。因此必须将链接分析与高频词信息内容紧密结合,开展整体的研究得到能够更好地排列实际效果。现阶段高频词部位权重计算排序算法仍是很多百度搜索引擎的关键排列技术性。



文章正文:鲁大师seo

<!– 文章来源:不明
–>
标题:浅谈高频词部位权重计算排序算法

原创文章,作者:鲁大师seo,如若转载,请注明出处:http://www.luseo.cn/archives/8689.html

联系我们

15284716688

在线咨询:点击这里给我发消息

邮件:524595840@qq.com

工作时间:周一至周日,9:30-18:30