本文主要对搜索引擎的工作原理做详细介绍,在学习谷歌seo教程的时候,明白其原理至关重要。
本文目录:
1、搜索引擎原理概述。
2、影响排名的9大因素。
3、如何研究搜索引擎算法规则。
一、搜索引擎原理
搜索引擎主要有两大功能:抓取并构建索引,为搜索用户提供最相关的排名结果。
1.抓取和索引
如果假设万维网是大型城市地铁系统中的一个个站点。
每个站点都是一个独特的文档(通常是一个网页,有时是PDF、JPG或其他文件)。搜索引擎需要一种方法来“爬行”整个城市并找到沿途的所有站点,因此他们会选择最佳路径可用链接。
网站的链接结构将所有页面绑定在一起。
链接允许搜索引擎的机器人(称为“爬虫”或“蜘蛛”)爬行并抓取网络上数十亿个互联文档。
一旦搜索引擎找到这些页面,它们就会从页面中解析代码并将选定部分存储在搜索引擎数据库中,以便未来在搜索查询需要时进行调用。为了完成可以在零点几秒内访问的数十亿页面的巨大任务,搜索引擎公司在全世界建立了数据存储中心。
这些巨大的存储设施可以容纳数千台机器,可以非常快速地处理大量信息。当一个人在任何一个主要引擎上进行搜索时,他们会立即返回结果;即使是一到两秒的延迟也会引起用户不满,因此搜索引擎必须尽快提供搜索结果。
2.提供搜索结果
搜索引擎属于一种应答系统。当一个人进行在线搜索时,搜索引擎会搜索其数十亿个文档的语料库并做两件事:首先,它只返回那些与搜索者查询相关或有用的结果;第二,它根据网站的受欢迎程度对这些结果进行排名。 SEO的过程旨在影响它的相关性和受欢迎程度。
搜索引擎如何确定相关性和受欢迎程度?
对于搜索引擎,相关性不仅仅意味着找到具有相关关键词的页面。在网络的早期,搜索引擎并没有更强的功能判断相关性,因此在当年可以通过关键词作弊欺骗搜索引擎并获得不错的排名结果。这么多年以来,工程师已经设计出更好的方法来将结果与搜索者的查询意图相匹配。今天,影响相关性的因素高达数百个,我们将在本指南中讨论其中最重要的因素。
搜索引擎通常假设网站、页面或文档越受欢迎,其包含的信息必须越有价值。在用户对搜索结果的满意度方面,这一假设已被成功验证。
相关性和受欢迎度是由搜索引擎使用算法大量计算后得出的排名结果。
这些算法通常包含数百个变量。在搜索营销领域,我们将它们称为“排名因素”。影响搜索引擎排名的9个因素:
1.整域链接指标:8.22 / 10
基于链接被引用指标,如链接数量,信任度,域名PageRank等。
2.页面链接指标:8.19 / 10
PageRank,信任度,链接数和根域的数量,锚文本分布,链接源的质量度与垃圾度比例等。
3.页面关键字和内容价值:7.87 / 10
关键词页面优化,主题内容聚合,内容数量/质量/相关性等算法得分
4.页面其他特征:6.57 / 10
内容长度,可读性,图片标识,唯一性,加载速度,结构化数据,HTTPS等
5.流量和查询结果的数据表现:6.55 / 10
SERP数量,点击率,访客流量/用户行为,网站和页面查询结果的数量/多样性/点击率。
6.域名品牌权威度:5.88 / 10
线下品牌知名度,在新闻/媒体中品牌提及度,网站是否关联浏览器工具栏数据。
7.域名URL是否包含关键词:4.97 / 10
完全匹配关键字域,部分关键字匹配等。
8.域名其他特征:4.09 / 10
域名长度,TLD扩展,SSL证书等。
9.页面级社会化指标:3.98 / 10
网页上的推特,Facebook,Google+等链接的数量/质量。
SEO人员如何成功?
搜索引擎的复杂算法难以理解。搜索引擎本身几乎没有提供如何获得更好结果或获得更多流量的参考指标。他们为我们提供的有关优化和最佳操作的内容如下所述:
Google建议通过以下方式获得更好的排名:
制作主要面向用户的页面,而不是搜索引擎。不要欺骗您的用户或向搜索引擎展示与向用户显示的内容不同的页面,这种做法通常被称为“隐藏真实内容”。
创建一个具有清晰层次结构和文本链接的站点。至少保证每个页面有一个文本链接指向。
创建一个有用的,信息丰富的网站,并编写清晰准确地描述。确保<title>元素和ALT属性具有描述性和准确性。
描述和URL包含关键词,且人性化。提供统一URL版本来访问每个页面,使用301重定向或rel =“canonical”属性来解决重复内容。
微软的Bing工程师推荐以下内容,以便在搜索引擎中获得更好的排名:
确保使用简介,关键字丰富的URL结构。
确保内容不会隐藏在富媒体(Adobe Flash Player,JavaScript,Ajax)中,并验证富媒体不会对爬虫隐藏链接。
创建关键字丰富的内容,并将关键字与用户搜索的内容进行匹配。定期制作新鲜内容。
不要将希望编入索引的文本放在图像中。例如,如果您希望将公司名称或地址编入索引,请确保它不会显示在公司徽标中。
此外,搜素引擎人员也做了许多努力,让大家了解搜索引擎,比如参与或组织搜索营销会议,在线博客和论坛来协助广大网站管理员。
二、如何研究搜索引擎规则
研究搜索引擎最有效的方式还是利用搜索引擎本身进行实验,测试假设并产出结论。通过这种迭代测试的过程,我们测试出了大量关于搜索引擎算法的认知。我们尝试过的一些实验是这样的:
1.使用无意义关键字注册新网站(例如,ishkabibbell.com)。
2.在该网站上创建多个页面,所有页面都针对类似的荒谬术语(例如,yoogewgally)。
3.使页面尽可能接近相同,然后一次更改一个变量,尝试放置文本,格式化,使用关键字,链接结构等。
4.给页面导入已被索引且抓取优秀的网页链接。
5.记录页面搜索排名。
6.对页面进行小的优化并评估它们对搜索结果的影响,以确定哪些因素可能会导致排名上升或下降。
7.记录所有看似有效的结果,并在其他域名或其他术语上重新测试它们。如果多个测试返回相同的结果,那么很可能会发现搜索引擎的排名规则。
在我们的测试中,我们从一个假设开始,即页面上较早链接比较晚链接承载更多的权重。我们通过创建一个毫无关键词含义的域名主页来测试这一想法,该主页包含指向三个指向远程页面的链接,这三个页面都在页面上恰好出现一次的相同无意义单词。在搜索引擎抓取页面后,我们发现主页上最早链接的页面排名第一。
除了这种测试之外,SEO人员还可以收集有关搜索引擎专利申请内容。其中最著名的是在20世纪90年代后期谷歌PageRank专利,专利号#6285999:“Method for node ranking in a linked database”。关于这一主题的原始论文:“Anatomy of a Large-Scale Hypertextual Web Search Engine”,也被大量研究。
通过专利分析,实验和实时测试等方法,SEO人员可以了解搜索引擎的许多基本操作以便创建高排名和高流量的网站。