Google 使用两个探测器来抓取网站上的内容: Freshbot 和 Deepbot 深度探测器 ( Deepbot 每月反击一次,受访内容在 Google 主要索引之中。刷新探测器 ( Freshbot 继续不时地发现新的内容,例如新的网站、论坛、博客等。 看起来, Google 发现了一个新的网页,之后再频繁地再访,来看看是否还有什么新的更新。如果有,这个新网站就会被加入到刷新探测器的名单中进行访问。 刷新探测器取得的结果是汇总在一个单独的数据库里。每一次刷新探测器进行新的一轮循环的时候都被重写。刷新探测器和 Google 主要索引是合在一起提供搜索结果的 Google操作模式 收集 ----> 采编 / 索引 ----> 反馈的工作顺序。事实上,搜索引擎包括以下几个元素。 抓取状态:搜索引擎派出探测器到互联网上不知疲倦地搜集网页。 网页仓库:搜索来的网页要集中在一个地方存储,等候索引处置。 索引整理:将网页分门别类,进行压缩,等候进行索引编类,而未压缩的原始网页资料被删除掉。 索引状态:将压缩后的网页编目在不同的索引之下。 问询状态:将用户问询所用的文言转换成搜索引擎读的懂的计算机语言,来咨询各个索引求得相关答案。 排名状态:搜索引擎将相关答案根据一定的规范以列表的形式排列给用户。搜索引擎认为最好的答案被推荐在首位,较次的排列随后,以此类推。 SEO 逆向搜索推理 网站首先要知道搜索引擎是怎样判定网站质量的这个揣度搜索引擎的过程是逆向推理。这个逆向推理是从搜索引擎的搜索排名开始,去探索究竟搜索引擎会将一些网站排列在搜索结果的前列,为什么一些网站连显示的机会都没有。 最后推理出的结论是知道搜索引擎判定和排名网站存在着哪些普遍规律,进而知道网站的设计和推广中哪些是应该做的哪些是不应该做的 Google PageRank PR PageRank 并非是页面等级 ” 而是佩奇等级 ” 因为这里的 Page 指的 Googl e开创人之一拉里 · 佩奇 ( Larri Page 从名字可以看出有的人天生就是为互联网而存在 公式 PR A = 1-d + d PR Ti /C Ti +...+PR Tn /C Tn PR A 网页 A 佩奇等级 ( PR PR Ti 链接网页 A 网页 Ti 佩奇等级 ( PR i 可以是 0-n n 链接的总数。这个链接可以是来自任何网站的导入链接 C Ti 网页 Ti 往其他网站链接的数量 ( 导出链接 ) d 阻尼系数,介于 0-1 之间, Google 设为 0.85 可以看出,网页 A PR 由链接它其他网页 Ti 所决定的如果在网页 Ti 中有一个链接指向网页 A 那么 A 就得到一个 “ 投票 ” 但是如果网页 Ti 中的导出链接如果越多,点击指向 A 可能性就越小。所以网页 Ti PR 只需要用 C Ti 来加权平均。 当然,决定网站排名的不只仅是 PR 值,还有其他因素。但是 PR google 判断网站质量中起着很重要的作用。 |
| 本文连接地址:http://www.511sj.com/html/wangzhanyouhua/542.Html |
编辑整理:北京网店建设 ecshop模板 ecshop模板 |