搜索是一个高度复杂的生态系统。
每当用户输入搜索查询时,搜索引擎就会应用强大的算法来显示与查询最匹配的页面,从而满足用户对信息的需求。
但是,搜索引擎如何确定针对查询显示哪些页面,以及以什么顺序显示?
换句话说,确定搜索排名的算法背后是什么?
如果能够破解Google的算法,则可以预测每个查询的每个搜索结果。
听起来像魔术?
不是。
它所要做的就是将高级数据科学应用于SEO。
了解搜索算法的复杂性
不管查询如何,搜索算法都会考虑并为许多不同参数的多个属性打分,以得出单个确定的等级。
为了能够产生有意义的搜索结果并准确地对页面进行排名,搜索引擎必须评估跨越以下范围的众多参数:
- 查询解释
- 查询的目的是什么?用户真正在寻找什么?
- 内容质量和深度
- 网页是否清晰,正确地回答了用户的查询?
- 页面的用户体验
- 是否容易找到必要的信息?
- 页面能否快速加载并提供无缝体验?
- 专长,权威和可信赖度(EAT)
- 网页,域/子域是否被视为相关主题的权威和专家?
- 信息和域可以信任吗?
- 品牌/域名的声誉
搜索引擎优化(SEO)出现以解决这些问题并最终推动搜索排名的提高。
实际上,SEO要求通过技术改进为内容增加价值,提高页面质量并增强搜索友好性。
但是从历史上看,SEO不仅仅是一种精确的科学,更像是一种猜测游戏。
搜索引擎优化从业人员和网站所有者无法理解搜索算法背后的关键参数,因此难以在一致,可复制的基础上优化搜索。
好消息是,它是可以进行搜索引擎优化的可预测性。
然而,这需要对度量,报告和提出SEO理由固有的挑战有敏锐的了解。
让我们看一下最重要的五个。
解决可预测性:识别和评估搜索参数方面的挑战
1.数据生态系统严重瘫痪
有许多企业SEO工具和浏览器扩展(包括免费和付费),可以很好地报告SEO性能指标(例如,排名,流量和反向链接)。例如:
- 技术SEO: Screaming Frog,Google Search Console,Google Analytics。
- 链接研究: Ahrefs,Majestic SEO,BuzzSumo。
- 关键字研究: Google关键字规划师,SEMrush,Ubersuggest,KeywordTool.io。
- SEO竞争分析: Searchmetrics,SEMrush,Ahrefs,BrightEdge。
但是,这些工具无法做到的是将关键的SEO指标组合到搜索性能的整体视图中。
在没有针对SEO的单一“真理点”的情况下,搜索专家必须整理来自多个来源的数据,以进行有意义的分析和建议。
这需要处理(和解释)并非所有SEO从业人员都拥有的大型数据集的技能。
因此,许多SEO专业人员可以凭直觉做出决策:这种方法有时有效,但会阻碍可扩展性和持续的成功。
2.指标太多,见解太少
即使一个人设法将所有这些数据元素放在一个地方,人类也不可能客观地筛选它们并确定有意义的行动项目。
同样,并非所有属性对于得分都具有同等重要的意义。
如果不解决这些多重共线性问题,搜索从业者就有可能在他们的分析中引入偏见并得出错误的结论。
如果能够破解Google的算法,则可以预测每个查询的每个搜索结果,听起来像魔术吗?不是。它需要将高级数据科学应用于SEO。
3.优化过程中的意外附带损害
一个页面有可能对多个关键字进行排名。
在正确的内容,正确的目标关键字和正确的优化工作之间找到平衡是一个挑战。
作为SEO从业人员,您可能会熟悉以下情形:
- 一个网站将包含涵盖同一主题主题的多个页面,并在这些页面上分布外部反向链接和目标关键字,以及未针对正确的目标关键字进行优化的最佳质量的链接。
- 站点进行重建或重新设计会对SEO产生负面影响。
- 当涉及优化优先级时,各个业务部门之间会发生利益冲突。如果没有一种机制来确定哪些优化工作将对搜索排名和业务结果产生最大的影响,那么就很难为一个优化策略提供商业理由。
4.标准点击率基准的不可靠性
每个URL在搜索引擎结果页(SERP)上不同位置处获得的点击次数存在很大的不确定性。
这是因为页面生成的点击率(CTR)是SERP布局中多个元素的函数,包括:
- 特定关键字的URL在SERP上的相对位置。
- 目标关键字自然搜索结果上方的广告数量。
- 显示的包(答案框,本地包,品牌包等)。
- 显示缩略图(图像,视频,评论,评分分数等)。
- 用户与品牌的品牌关联。
通过排名排名计算点击率只是一项衡量挑战。
由于难以确定页面将产生的转换率和每次转换的估算值,因此SEO的真正业务影响也难以把握。
搜索专业人员必须具有强大的分析能力才能计算这些指标。
5.无法建立业务案例以进一步投资数据科学
在制定投资决策时,业务利益相关者希望了解单个计划对业务结果的影响。
如果一项举措可以量化,则更容易获得必要的投资水平并确定工作的优先级。
这就是SEO经常挣扎的地方。商界领袖发现SEO的努力是反复无休止的,而搜索从业者则在试图将排名与对流量,转化,潜在客户和收入的影响相关联方面处于不足。
与其他渠道产生的更可预测,可衡量和即时的结果相比,SEO的投资回报率对于领导者来说似乎很小。
进一步的复杂性是内部建立数据科学过程以开始解决SEO可预测性所需的投资和资源。
技能,人员,评分模型,文化:挑战艰巨。
使SEO可以预测:评分模型的需求
现在我们已经确定了通往可预测性的道路充满了挑战,让我们回到我最初的问题。
SEO是否可以预测?
通过投资使SEO可预测性变为现实是否有价值?
简短的回答:是的!
在iQuanti,我们专用的数据科学团队通过三个步骤解决了SEO可预测性问题:
- 步骤1:定义指示SEO成功的指标,并将来自最佳资源的全面数据集成到单个仓库中。
- 步骤2:通过针对相关性,权限和可访问性信号开发评分模型和机器学习算法,对Google的搜索结果进行反向工程。
- 步骤3:使用算法的输出来获取对页面/站点性能的具体且可操作的见解,并开发模拟功能以在推向生产之前测试策略(例如添加反向链接或进行内容更改),从而使SEO可以预测。
步骤1:确定关键变量和数据集成
如前所述,SEO成功的主要障碍之一是无法将所有必要的指标整合到一个地方。
SEO团队使用大量工具和浏览器扩展来收集性能数据-既包括自己的数据,也包括比较/竞争数据。
但是,大多数企业SEO平台失败的原因是,可以在一个视图中访问任何特定关键字或页面的所有SEO变量和指标。
这是第一步也是最关键的一步。尽管它需要访问各种SEO工具和基本的数据仓库功能,但相对而言,这一重要的第一步在实践中变得相对容易实现。
我们尚未进入需要大量技能和资源的数据建模阶段,但是有了合适的数据分析团队,数据本身的集成可能被证明是实现SEO可预测性的重要第一步。
怎么样?
让我举例说明。
如果您能够将URL www.example.com的所有SEO指标汇总在一起,并且了解每个指标的价值,则可以轻松建立一个简单的比较评分模型,使您可以将URL与性能最高的URL进行比较正在搜索。见下文。
专业提示:对于文本数据(或内容),请考虑以下变量的组合:
- 单词使用的频率。
- 关键字的完全匹配和部分匹配。
- 使用TF-IDF,Word2Vec或GLoVe的相关性指标。
对于链接数据,请考虑:
- 指向目标页面的链接的相关性。
- 链接页面/域的权限分配。
- 跟踪/不跟踪链接的百分比。
自动执行此操作,您就可以使用可靠且连续的基准测试过程。每次您实施针对优化的更改时,您实际上都可以看到(并测量)SERP上的指针移动。
在一段时间内跟踪您的分数及其组成部分可以深入了解竞争对手所采用的策略(例如,他们是在提高页面相关性还是在积极建立权威)以及相应的反动措施,以确保您的网站在竞争中始终如一地竞争高水平。
步骤2:建立算法评分模型
搜索排名一次反映了多个变量的集体效应。
要了解任何单个变量对排名的影响,我们应确保在此孤立变量发生变化时,所有其他参数保持恒定。
然后,要获得“分数”,有两种方法可以解决建模问题:
- 作为分类问题[好与不好]
- 在这种方法中,您需要将所有排名前10位的URL(即第一个SERP上的URL)标记为1,将其余的标记为0,并尝试了解/反向工程如何将不同的变量对位于首页的URL产生影响。
- 作为排名问题
- 在这种方法中,等级被认为是连续的度量标准,并且模型了解变量对等级更高或更低的重要性。
创建这样一个环境,我们可以识别多个变量的个体和集体影响,需要大量的数据集。
虽然搜索引擎在对页面进行排名时会考虑数百个变量,但它们可以大致分为内容(页面上),权限(页面外)和技术参数。
我建议着重开发一个评分模型,以帮助您分配和衡量以下四个要素的分数:
1.关联分数
该分数应查看页面内容元素,包括:
- 与目标搜索关键字相比,页面主要内容的相关性。
- 页面的标记元素(例如,标题,H1,H2,image-alt-txt,元描述等)传达页面的内容信号的程度。
2.权威评分
这应该捕获授权信号,包括:
- 页面的入站链接数。
- 提供这些链接的网站的质量级别。
- 给出这些链接的上下文。
- 上下文是否与目标页面和查询相关。
3.辅助功能得分
这应该捕获获得良好体验所需的站点的所有技术参数-页面的可爬网性,页面加载时间,规范标签,页面的地理位置设置等。
4.点击率算法/曲线
点击率取决于各种因素,例如关键字需求,行业,关键字是否是品牌名称以及SERP的布局(即SERP是否包含答案框,视频,图像或新闻内容)。
此处的目的是确定每个排名位置的估算点击率,从而使SEO专业人士了解每个关键字如何对总体网页访问量产生影响。
这使SEO程序更容易监视最重要的关键字。
如果您可以比较这三个子得分和基础属性,则可以清楚地识别出性能不足的原因-目标页面是否不够相关,或者网站是否对该主题没有足够的权限,或者技术经验中有什么可以阻止该页面排名。
它还将查明导致差距的确切属性,以为内容团队提供具体可行的见解。
步骤3:策略与模拟
理想的系统将更进一步,以开发SEO专业人员不仅可以发现可行见解的环境,而且还可以通过在实际实施实时环境中的更改之前评估影响来模拟建议的更改。
模拟变更和评估影响的能力将可预测性建立到结果中。在SEO程序中,这种模拟功能的潜在应用是巨大的。
1.规划和优先级的可预测性
资源和预算总是有限的。定义在何处应用优化工作以获得最大的收益是一个挑战。
预测模型可以计算出品牌垂直行业中所有关键字的页面与排名最高的页面之间的差距。
差距的程度,弥补差距所需的资源以及可以在各个级别获得的潜在流量可以帮助您确定短期,中期和长期的优化工作的优先级。
2.通过内容,权限和可访问性模拟对排名和流量进行可预测性
内容模拟模块将允许模拟内容更改,并可以评估相关性得分以及由此带来的潜在排名提高。
使用这种模拟工具,用户可以专注于改善效果不佳的属性并保护驱动排名和访问量的页面元素。
仿真环境可以使用户能够测试假设的优化策略(例如,更新的反向链接和技术参数)并预测这些更改的影响。
然后,SEO专业人员可以做出明智的选择,以决定实施哪些更改以提高性能,同时保护任何现有的高性能页面元素。
3. SEO工作对业务影响的可预测性
SEO专业人员可以使用该模型来确定他们的更改是否有任何底线影响。
在任何给定或预测的排名上,SEO专家都可以使用CTR曲线来确定域在特定位置可能会收到的点击类型。
将其与网站分析和转化率数据集成在一起,可以将转化与搜索排名相关联,从而根据转化或收入来预测您的SEO工作对业务的影响。
最后的话
在开发SEO评分模型时,没有万能的。我的尝试一直是对可能发生的事情给出高层次的看法。
如果您能够以最细粒度的方式捕获数据,则可以按所需方式对其进行汇总。
这是我们在iQuanti上的经验:一旦您踏上了这一旅程,您将遇到更多问题,找出新解决方案,并开发出将这种数据用于您自己的用例的新方法。
您可以从简单的线性模型开始,但很快就会提高其准确性。您可能会考虑非线性模型,不同模型的集合,不同类别的关键字的模型-高容量,长尾巴,按行业类别等等。
即使您无法构建这些算法,我仍然会在此练习中看到价值。
如果只有少数SEO专业人员对数据强大的力量来帮助建立可预测性感到兴奋,那么它可以完全改变我们进行搜索优化的方式。
您将开始在日常SEO活动中引入更多数据,并开始将SEO视为可量化,可报告和可预测的定量练习。