搜索引擎蜘蛛最感兴趣的信息是页面的文字部分

2023-03-03 08:05 作者:文砚就爱马可婷 0人读过 | 我要投稿

搜索引擎的另一个任务是判断内容的价值。虽然在判断的过程中要通过链接分析评估其他人对页面内容有什么反应，搜索引擎也可以基于在页面上看的内容得到一些结论。

比如，同样的内容是否出现在另一个网站？搜索引擎看到的独特内容是两句话还是500多个字？内容是否大最重复同一个关键词？这些只是搜索引擎确定一段内容的价值时可以考察的几个方面。

搜索引擎能在页面上“看”到什么内容

搜索引擎蜘蛛和索引程序基本上就是软件，这些软件程序非常强大。它们爬过无数的页面，分析这些网页的内容，并分析它们之间的链接方式，然后把这些信息组织成一系列数据库，当用户搜索时不到一秒就能返回一串排完序的结果。

这是个很高的成就，不过也有局限性。软件是非常机械的，它只能理解页面的一部分。搜索引擎蜘蛛分析页面的原始HTML 代码。当然你自己也可以在浏览器中右击然后选择查看源代码。

通过查看源代码，你可以看到网站服务器发送给浏览器的代码。这就是搜索引擎蜘蛛所看到的内容（搜索引擎还能看到页面的 HTTP 头信息）。蜘蛛会忽略代码里的很多内容。

搜索引擎蜘蛛最感兴趣的信息是页面的文字部分。

但是从代码中可以清楚地看到普通文字，这就是蜘蛛在寻找的独特内容。

另外，搜索引擎也读取其他内容。其中之一就是页面标题。页面标题是影响排名最重要的因素之一。页面标题里的文字显示在浏览器标题栏中（浏览器菜单和地址框上面的蓝色部分）。

搜索引擎蜘蛛最感兴趣的信息是页面的文字部分的评论 (共条)