[置顶] Lynx在线版以及浏览器插件

网络蜘蛛基本原理

网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
    对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。这其中的原因一方面是抓取技术的瓶颈,无法遍历所有的网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,如果按照每个页面的平均大小为20K计算(包含图片),100亿网页的容量是100×2000G字节,即使能够存储,下载也存在问题(按照一台机器每秒下载20K计算,需要340台机器不停的下载一年时间,才能把所有网页下载完毕)。同时,由于数据量太大,在提供搜索时也会有效率方面的影响。因此,许多搜索引擎的网络蜘蛛只是抓取那些重要的网页,而在抓取的时候评价重要性主要的依据是某个网页的链接深度。

...

网页信噪比相关文章摘录

网页信噪比相关文章摘录

信噪比,即SNR(Signal to Noise Ratio)又称为讯噪比,狭义来讲是指放大器的输出信号的电压与同时输出的噪声电压的比。
  所谓网站中的网页信噪比是指和目标关键词相关的内容占总网站内容的比例。在网页优化中,搜索引擎主要抓取除去html标签后的文本内容,这部分内容可以认为是不失真声音信号,而同时产生的那部分html标签内容, 可以被认为是噪声。因此,网页信噪音比,可以这样理解:指网页中的文本内容部分与生成这些文本而产生的html标签内容的比率。声学中,信噪比越高,说明声音信号越清晰,同理,网页信噪比越高,说明页面中纯文本内容相对越多,搜索引擎抓取页面也越容易。减少网页中的图片、flash,将html转化为css样式表,封装css、js等,能大幅度提高网页信噪比。有用信息除以总代码长度。其实就是纯文本,除以代码长度。任何一种计算方法,都以蜘蛛读取最少数据获得最多有用信息为依据,这个原则是对搜索引擎最友好的原则。
...

网站结构的扁平化 链接系统 导航系统 内容系统

网站结构在代码优化中起着关键性的作用。下面,主要探讨这方面的内容:
1、网站结构中的“流体理论”。所谓流体,就是指内部链接的流动。一般而言,google最认可的链接流动是“关键词流动”。换而言之,导入链接的链接文字和本页面的优化关键词、网页标题、Logo的Alt文字、正文的第一段话的最前面部分是一致的。如果一个网站,所有的页面都以“关键词流动”而形成一个链接系统,那么这个的系统的相关性是很强的。—链接系统
...

搜索结果前十名点击率的巨大差距

摘自网络的一篇文章:索结果页面(SERP)尤其是前10名的点击量的分布情况:
取样数据包括:
搜索次数:9,038,794
点击次数: 4,926,623
其中不同位置的点击情况如下:
位置    点击次数       与第一名的比较     与前一位比较
第一名  2,075,765      —                  —-
...

内部链接还是外部链接?国平 发表在 SEO策略

这篇文章承接上篇《热门还是长尾?大中型网站的关键词优化策略》。明白了长尾效应在一个大中型网站中的作用后,还需要明白内外部链接谁更重要。

在搜索引擎上,去获取流量的最基本单位就是网页。一个网页的外部链接因素,对这个网页的排名影响很大。这个网页的外部链接,既有同一个网站的其他页面给的站内链接,也有其他网站上的网页给的站外链接。下面文章里的内部链接是指站内链接,外部链接是指站外链接。那么在优化一个网站的时候,是特别注意优化内部链接还是外部链接呢?或者在分析一个网页排名的时候,是觉得内部链接贡献的价值大,还是外部链接的价值大?

...

如何把自己伪装成googlebot?

如何把自己伪装成googlebot? 断章取义自猎眼追词博客: 隐形页面是对搜索引擎显示的网页版本(与对使用者显示的版本不同),意图蒙骗搜索引擎及影响该网页在搜索索引中的排名。如果你是用IE,火狐或其他浏览器来打开这些被黑的网站,这个技术会对访问者的User Agent进行了判断,对于所有没有声称身份的访问,包括Baiduspider Googlebot等搜索引擎爬虫返回另一个结果,如果你要识别这种欺骗,你需要修改自己的浏览器设置,以搜索引擎爬虫的方式来浏览网页:

设置方法:

...

12月1日网站大面积被K的原因分析-摘自seo三人行

一篇摘自seo三人行论坛的文章,谈了昨天很多网站被K的看法,这两天也接触和听到不少这样的消息,看到这篇文章觉得还是有道理的,不过不知道这个信息他是从哪里的来的!
仁者见仁 智者见智吧

今天一早上班打开电脑,访问我们医院的网站,发现安装插件下面显示的百度收录数为0,立刻使用查询工具,还有其他查询网站,证实我的网站确实被K,再上QQ看见我加入的长沙医疗同行的群,发现大家网站全部被K,原来我们网站被K不是个别现象,是百度的大面积K站。我们这些医院网站的PR都是4以上,建站都超过4年,近期都没有做什么框架改动,最多就添加文章,按道理来说应该不会被K。
...

决定你是否能成为SEO高手的最重要的一点

决定你是否能成为SEO高手的最重要的一点是:不仅会装,还要会扯。
当大家都很会扯的时候,高手扯得肯定比你疼,不是他们蛋比较敏感,而是他们的确更用力。

当你说我是SEO时,高手肯定说现在我在做的是SEM。
当你说我是SEM时,高手肯定在说我现在在做MKT。
你怒了:为什么你总走在我前面?
高手看着你无辜的眼神:因为你比我先说!

你说我做热词排名,高手说我在做长尾建设。
你说我在群发长尾链接,高手说我在做站内优化。
...

热门还是长尾?大中型网站的关键词优化策略

国平 发表在 SEO策略 于 2009年,十一月 14th
接下来的两篇文章,会讨论网站是选热门关键词还是长尾关键词,以及应该注意内部链接还是外部链接。

相信很多SEOer都有这样经历:开始做一个网站的SEO的时候,都是先选一些计划中要排名的词语,希望藉由这些词语在搜索引擎上获得大量的流量。在这些词语中,有些人选的是些热门词;有些人明智一点,是一些在当前的能力下能做到的适当热门的词语。在接下来的过程中,会集中很多的“资源”来做这些这些词语的排名。包括在title中适当的重复这些关键词;突出这些关键词的密度;外部链接指向这些关键词页面等等。不过,在计划中的词语还没有排名的时候,很多人会发现网站其实已经有一些SEO流量了。而去分析流量就会发现,流量几乎都不是计划中的这些关键词带来的,而是各种各样奇怪的长尾词。等到计划中的关键词有好的排名的时候,根据网站的不同,有些网站可能大部分流量靠那些热门关键词贡献,而有些网站则不然。

...

竞争页与内部链接优化(核桃QQ群聊天记录)

[完整版]核桃QQ群聊天记录第2辑(竞争页与内部链接优化)

...
分页:[«]1[2][3][»]