网页信噪比相关文章摘录
信噪比,即SNR(Signal to Noise Ratio)又称为讯噪比,狭义来讲是指放大器的输出信号的电压与同时输出的噪声电压的比。
所谓网站中的网页信噪比是指和目标关键词相关的内容占总网站内容的比例。在网页优化中,搜索引擎主要抓取除去html标签后的文本内容,这部分内容可以认为是不失真声音信号,而同时产生的那部分html标签内容, 可以被认为是噪声。因此,网页信噪音比,可以这样理解:指网页中的文本内容部分与生成这些文本而产生的html标签内容的比率。声学中,信噪比越高,说明声音信号越清晰,同理,网页信噪比越高,说明页面中纯文本内容相对越多,搜索引擎抓取页面也越容易。减少网页中的图片、flash,将html转化为css样式表,封装css、js等,能大幅度提高网页信噪比。有用信息除以总代码长度。其实就是纯文本,除以代码长度。任何一种计算方法,都以蜘蛛读取最少数据获得最多有用信息为依据,这个原则是对搜索引擎最友好的原则。
----------------------------
信噪比(Signal/Noise),原是电声学领域中的一个概念,指声音源产生最大不失真声音信号强度与同时发出噪音强度之间的比率。在网页优化中同样存在这样的原理,搜索引擎抓取页面,主要抓取除去html标签后的文本内容,这部分内容可以认为是不失真声音信号,而同时产生的那部分html标签内容,可以被认为是噪音。因此,网页信噪音比,可以这样理解:指网页中的文本内容部分与生成这些文本而产生的html标签内容的比率。声学中,信噪比越高,说明声音信号越清晰,同理,网页信噪比越高,说明页面中纯文本内容相对越多,搜索引擎抓取页面也越容易。提示:减少网页中的图片、flash,将html修饰转化为css样式表,封装css、js等,能大幅度提高网页信噪比,一般来说网页信噪音比小于30%为比较合理。
----------------------------
前一段时时间seoer里有人提出了网页的“信噪比”概念,其主要的意思是参照声学里的概念(是指放大器的输出信号的电压与同时输出的噪声电压的比,常常用分贝数表示。设备的信噪比越高表明它产生的杂音越少。一般来说,信噪比越大,说明混在信号里的噪声越小,声音回放的音质量越高,否则相反。)其意思是:指网页中的文本内容部分与生成这些文本而产生的html标签内容的比率。我认为这样的理解是比较片面的,因为不管是蜘蛛还是机器人程序在抓取页面的过程中,考虑的参数很多,比如:网页的pr数值等,有些人针对这个概念做了一些技术处理对语言结构比如将flash,css封装等方法使信噪比更优化,但在网页的收录过程中,并不以此为重要的依据,因为在各种链出中,还是会区各种站点的指向和外联的站点的权重,,这样就不难解释有些网页以纯文本方式体现的网页和关键字词密度以及大小一样的网页在搜索引擎返回的结果高的原因.并且也能合理说明在一些搜索结果中,关联一个网站的第一页是网站的某个以文字出现的页面,而第二页才是该站的首页。
另外还有一个问题是,如果在页面中的文字和外链站点与文章内容相关性不好,也会减低整体的网页信噪比,我这里有一个实际的案例,:我工作原因发布了一个新闻稿一个是在一个我们公司站点上发布的,一个是在网易上大部的,发布时差在10分钟左右,在第二天的搜索发现公司站点网页竟然排在了sohu那条新闻的前面,,我们的pr=3,网易的是7,从框架上分析以后,整体是没有大的区别,那么唯一的区别是网易的新闻页面有些文字广告和一个flash广告,由此可以说明在页面中内容的关联性和排它性在整个网页信噪比的权重一而是很大的。所以我认为的网页信噪比的更准确的概念应当定义为:网页中的文本文件以及其他各种参数因素(包括图片、flss、css、内部链接 )和网页html标签内容的比率。