准备分析Google的搜索算法并了解排名的所有秘密了吗?这是您需要正确执行的操作。
“您想在广告上花钱还是解决这个黑匣子?”
这个(粗略的)问题有助于确定我10年前成为我今天的SEO的职业道路。
我之所以选择这条道路,是因为我喜欢挑战,并在幕后寻找导致事情发生的原因。
寻求解决生命,宇宙和一切的答案,借助Google Deep Thought(42),然后再次确认我有一个正确的问题(破坏者:9的6倍),这让我对SEO感到兴奋。
而让我着手撰写这篇文章的正是关于杰夫·弗格森(Jeff Ferguson)的帖子的精彩讨论,内容涉及我们是否具有数学运算来解码Google的算法,如果是,该行业需要什么?
需要两件事
因此,对于那些认识我的人来说,看到我反对这样的观点,即使使用Spearman系数进行基本的相关性分析就足以分析Google的算法,您也不会感到惊讶。
自从我在2011年SMX East演讲后,我公开倡导使用多元线性回归作为应如何分析重要问题的最低要求。
其他先进的统计方法,无论是机器学习还是神经网络,都可以发挥作用。
但是对于本文,我主要关注回归。
使用统计方法的一个重要警告是,单独使用或最终使用的工具本身并不能视为一项很好的研究。
在这里,具有合适的数据分析技能和SEO经验就可以发挥作用。
正如在COVID-19分析中反复看到的那样,仅具有数据分析师背景还不足以声称可以解决流行病学专家在Medium或Twitter帖子中提出的挑战。
尽管有些人似乎可以帮助提供有价值的想法,但大多数人却没有采取谨慎的态度,谦卑的态度允许错误信息传播。
我是否需要提醒业界,当SEO错误信息被非搜索专家传播到新闻中时会发生什么?
“我不是统计学家,但是……”
好的,那是什么赋予我指向研究高级统计学方向的权利?
我在国际经济学专业学习国际关系硕士学位,在那里我学习了计量经济学,并高兴地将有关计量经济学的论文撕裂了中国的经济。
您会在Twitter上找到我,将SEO相关性研究一分为二是有原因的。
那么,为什么要回归呢?
首先,不再是孤立地分析单个度量。
取而代之的是,它涉及多种指标,这些指标也可能在影响排名的因素上相互影响。
仅在这一点上,就要求至少使用多线性回归。
除此之外,SEO不再关注单一指标而不是谈论多个因素,而是促使SEO更加广泛地考虑可用于改善排名的一系列全面指标。
另一方面,这会优先处理工作,因为1,000个指标似乎令人生畏,但如果900+指标几乎不动0.1%,那么确定要进行哪些工作就可以加快优化任务。
此外,将时间序列与回归分析结合使用(在其中进行分析的是在设定的时间段内而不是在特定时间点上的因素)可以帮助消除每日或每周的变化以专注于核心领域,同时提供对以下方面的深入了解哪些主要算法更新发生了变化。
对于希望获得信誉的代理商,请向科学领域寻求如何对复杂区域进行回归分析。例如:
- 海平面上升。
- 超导材料科学。
- 或者,如果您想要更接近SEO的产品,那么可以推动自然的零售网站流量。
尽管很少见,但确实有SEO研究论文的特定论文可以进入。
良好的分析能力很重要
从逻辑上讲,向某人提供未经正确培训的工具并不意味着这会自动导致良好的结果。
这就是为什么拥有正确的好奇心态(愿意像高级用户一样)进行深入研究并将数据放入铃声的原因,将补充高级统计工具。
这种心态将有助于确定:
- 收集什么数据。
- 有方向性的东西。
- 甚至在开始分析之前就将其删除。
这是一项基本标准,需要一定的SEO经验,尤其是要提前识别出哪些指标可能是基本原因以及如何避免在受众特征,季节性,购买者意图等方面产生偏见。
拥有SEO经验还意味着,分析将有更好的机会来分析有价值的交互效果,尤其是当孤立的优化可能不被视为垃圾邮件,除非结合其他策略一起使用。(例如,白色背景中大段文字中的白色文本,用户看不到它)
此外,知道Google没有使用单一的整体算法意味着任何分析都需要包括类别或组,可以通过以下方式进行:
- 关键字意图。
- 搜索量。
- 排名位置。
- 行业。
- 等等。
还有更多原因检查数据散点图以确保不存在以下问题:
- 异方差:由于变异性不相等而向外散开的数据。
- 辛普森悖论(Simpson’s Paradox):两个不同的种群显示相同的趋势,将它们组合在一起将得出相反的趋势。
因此,散点图或晶须图是这些分析中必不可少的一种方法,以表明研究避免了常见的统计问题。
对于结果,提供标准的回归结果格式可帮助具有统计背景的人员快速轻松地查看结论,而不必单独运行回归即可再次检查对结果的主张。
因为统计研究的关键部分,以及许多公开推广的SEO研究过程中普遍存在的失败,所以解释远非合理。
经常将轻率的声明用作链接诱饵,而不是向SEO社区阐明。
当我深入这些研究时,我经常问自己:
- 数据集是否排除了诸如Wikipedia或Amazon之类的潜在异常值?
- 如果声称的点击率影响排名,则该研究如何处理排名影响点击率的内生性?
- 直接流量会影响排名的奇妙说法是否有非凡的证据来证明这一点?
- 为什么在X轴上显示排名?好吧,最后一个更像是我的宠物。
这就是同行评审的目的。
仔细检查自己的工作是否不正确是一回事。
同行评审通过帮助发现盲点,挑战所作的假设,提高学习质量并确定工作适合大型SEO社区信任的方式,将其提升到另一个层次。
一劳永逸吗?
在理想的世界中,是的!
实际上,要达到目标可能需要几个步骤(和一些错误步骤)。
我以及许多具有统计意义的SEO都没有要求遵循一个示例。
要生成模型创意,请看一下:
- 我的2019 TechSEO Boost演示文稿。
- 迈克尔·金(Michael King)的运行时视频。
有关如何编写回归研究以及如何使用Python运行线性回归模型的信息,请参见Hulya Coban的文章。
如果我们真的想真正地了解Google算法中正在发生的事情,建立对研究的信任的坚实基础,并阻止其中的虚假信息,那就是SEO行业需要去的地方。
那这项研究呢?
好,这要看情况。
更准确地说,当相关研究和软件指标有价值时,应考虑Russ Jones的可接受的例外情况和一些明显的对策。
我没有反对私有化相关性研究作为内部业务用例的理由。
吃吧
时间在商业世界中是宝贵的,因此,请尽您所能,并在失败时拥有自己的一切。
在公共领域,通过使用具有正确书面关注的正确分析框架或着重研究Google SERP的逐年变化,已经对一些有价值的研究进行了深思熟虑。
强调数据透明性的方法论的文章因其开放性而应受到称赞。
另外,还有通过SearchPilot之类的工具进行SEO实时测试的研究。
它们的数学结构更合理,自2011年以来,我一直与开发人员合作进行内部构建,并公开展示了它们的价值。
因此,这些研究的工作(从将PPC标题用于SEO到在Pinterest上进行的实验)是一个很好的垫脚石,如果您需要它的大量流量。
让我们向上移动
除此以外,对于行业需要实现的目标而言,先进的统计方法和扎实的数据分析技能以及SEO经验是必不可少的。
并且有足够的具有统计意义的SEO愿意帮助,审查和提供建议,以使研究变得权威。
是的,每当有新研究发表时,这些SEO都会在Twitter线程中进行大量批评,但这是出于对业界声誉的关怀,以防止研究观点被误解而导致不良SEO以及对他人的渴望。学习如何更好地分析复杂的系统。
尽管由于需要依赖历史数据以及随着时间的推移维护量会导致结果产生偏差,因此多线性回归模型并不完美,但对于SEO行业而言,这仍然是朝正确方向迈出的一步更注重统计。
简而言之…
如果您有足够的数据量(以及时间和资源)来完成此任务,并且想要成为业内第一个SEO代理商,顾问等,则需要这样做:
- 先进的统计模型,例如多线性回归。
- 具有SEO经验的好奇心态。
- 大量指标,并通过具有方向性的指标减少了尺寸。
- 互动指标。
- 数据的组和类别。
- 大于一周的时间。
- 审查了内生性,异方差性和其他偏见。
- 删除数据异常值(如果有)。
- 方法论解释。
- 散点图和回归数据格式展示的工作。
- 索赔有足够的证据支持。
- 对数据进行分析并进行同行评审。