W1 Cybertech

W1

解读谷歌现行排名算法系统2023

谷歌关键词排名算法系统

最近,谷歌更新了官方开发者文档,其中介绍了谷歌搜索排名系统的运作方式。谷歌使用自动化的排名系统,考虑了数千亿个网页以及其他内容的因素和信号,以在几分之一秒内呈现最相关和最有用的搜索结果。谷歌会定期对这些系统进行严格的测试和评估,以不断改进排名系统。当排名系统更新可能对内容创建者和其他用户有用时,谷歌会发布通知。需要注意的是,这些更新通常是核心更新,涉及排名信号权重的调整或增减排名信号,可能会引起较大规模的波动。

仅2021年谷歌就对搜索引擎排名算法更新了4366次,当中不乏多次核心更新。核心更新指的是各个排名信号权重的调整,也有可能涉及到增减排名信号,通常带来更大范围波动。在2022年,谷歌提出的最重要的排名系统更新就是针对网站文字内容的要求:有帮助的内容,即原创的、有用的、高质量的内容。请注意,以下内容使用谷歌翻译生成,如有辞不达意,还请见谅。如有问题,欢迎联系W1咨询。

BERT

Bidirectional Encoder Representations from Transformers ( BERT ) 是谷歌使用的一个人工智能系统,它使我们能够理解单词组合如何表达不同的含义和意图。

危机信息系统

谷歌开发的系统可以在危机时期提供有用且及时的信息,无论这些危机涉及个人危机情况、自然灾害还是其他广泛的危机情况:

  • 个人危机:我们的系统致力于了解人们何时寻求有关个人危机情况的信息,以显示来自受信任组织的热线和内容,以解决与自杀、性侵犯、中毒、性别暴力或毒瘾相关的某些问题。
  • SOS 警报:在自然灾害或广泛危机情况下,我们的SOS警报系统会显示来自地方、国家或国际当局的更新。这些更新可能包括紧急电话号码和网站、地图、有用短语的翻译、捐赠机会等。详细了解SOS 警报的工作原理,以及它们如何成为谷歌危机警报的一部分,在发生洪水、野火、地震、飓风和其他灾难时提供帮助。

重复数据删除系统

在谷歌上搜索可能会找到数千甚至数百万个匹配的网页。其中一些可能彼此非常相似。在这种情况下,我们的系统只会显示最相关的结果,以避免无用的重复。详细了解 重复数据删除的工作原理,以及 在进行重复数据删除时如何根据需要查看省略的结果。

重复数据删除也会发生在精选摘要(即Featured Snippet,置顶的第0位结果,有时也和知识图谱一起出现)中。如果网页列表被提升为精选摘要,我们不会稍后在结果的第一页上重复列表。这会整理结果并帮助人们更轻松地找到相关信息。

精确匹配域名系统

我们的排名系统将域名中的单词视为确定内容是否与搜索相关的众多因素之一。但是,我们的完全匹配域名系统可以确保我们不会过多地信任在旨在完全匹配特定查询的域名下托管的内容。例如,有人可能会创建一个包含“best-places-to-eat-lunch”字样的域名,希望域名中的所有这些字词都能推动内容在排名中名列前茅(如购买域名best-places-to-eat-lunch.com)。我们的系统会为此进行调整。

保鲜系统

我们有各种“查询结果需要新鲜度”的系统,旨在为预期的查询显示更新鲜的内容。例如,如果有人正在搜索一部刚刚上映的电影,他们可能想要最近的评论,而不是制作开始时的旧文章。再例如,通常搜索“地震”可能会带回有关准备和资源的材料。但是,如果最近发生地震,则可能会出现新闻文章和更新鲜的内容。

有用的内容系统

我们有用的内容系统旨在更好地确保人们在搜索结果中看到由人们为人们编写的原创、有用的内容,而不是主要为了获得搜索引擎流量而制作的内容。(这是一个网站级的系统,当前仅在英文中实装,如果被判定为无用网站,那么每个页面都会受到影响。)

我们有各种系统可以了解页面如何相互链接,以此来确定页面的内容以及哪些页面可能对响应查询最有帮助。其中包括PageRank(只有谷歌用PageRank,以它的创始人Larry Page命名),这是我们在谷歌首次推出时使用的核心排名系统之一。那些好奇的人可以通过阅读原始的PageRank 研究论文专利来了解更多信息。从那时起,PageRank的工作方式发生了很大变化,并且它仍然是我们核心排名系统的一部分。

本地新闻系统

我们的系统可以在相关时识别和显示本地新闻来源, 例如通过我们的“头条新闻”和“本地新闻”功能。

MUM

多任务统一模型(MUM)是一种能够理解和生成语言的AI系统。它目前不用于搜索中的一般排名,而是用于某些特定应用程序,例如改进对COVID-19疫苗信息的搜索以及改进我们显示的精选摘要标注。(用谷歌自己的话说MUM比BERT强大一千倍,能够理解和生成语言。它同时接受了75种语言和许多不同任务的训练,使其能够更全面地理解信息和世界知识。MUM也是多模态的,这意味着它可以在未来理解跨多种模态的信息,例如文本、图像等。)

神经匹配

神经匹配是一种人工智能系统,谷歌使用它来理解查询和页面中概念的表示并将它们相互匹配。(帮助我们理解查询和页面中概念的模糊表示,并将它们相互匹配。再敲一次黑板,所以关键字不重要,重要的是意义。)

原创内容系统

我们有系统来帮助确保我们在搜索结果中突出显示原创内容, 包括原创报告,领先于那些仅仅引用它的人。这包括对特殊规范标记的支持(rel=”cannonical”), 可以使用它来帮助我们更好地理解如果某个页面在多个地方被复制,那么什么是主页面。

基于移除的降级系统

谷歌的政策允许删除某些类型的内容。如果我们处理涉及特定网站的大量此类删除,我们会将其用作改进结果的信号。尤其是:

  • 合法删除:当我们收到大量涉及给定网站的有效版权删除请求时,我们可以使用它来在我们的结果中从该网站中降级其他内容。这样,如果有其他侵权内容,与原始内容相比,人们遇到它的可能性更小。我们对涉及诽谤、假冒商品和法院下令移除的投诉应用类似的降级号。
  • 个人信息删除:如果我们处理大量涉及具有有偿删除做法的网站的个人信息删除,我们会在结果中将该网站的其他内容降级。 我们还会查看其他网站是否正在发生相同的行为模式,如果是,则对这些网站上的内容进行降级。对于收到大量doxxing人肉搜索内容删除的网站,我们可能会采用类似的降级做法。此外,我们有自动保护措施,旨在防止未经同意的露骨个人图片在涉及姓名的查询中排名靠前。

页面体验系统

人们更喜欢提供出色页面体验的网站。这就是为什么我们有一个页面体验系统来评估各种标准,例如页面加载速度、移动设备友好性、页面是否缺少侵入性插页式广告以及页面是否以安全方式提供。在存在许多具有相对相等相关性的可能匹配的情况下,系统有助于优先选择具有更好页面体验的内容。

段落排名系统

段落排名是一种人工智能系统,我们用它来识别网页的各个部分或“段落”,以更好地了解网页与搜索的相关程度。

产品评论系统

产品评论系统旨在更好地奖励高质量的产品评论,内容提供有见地的分析和原创研究,由熟悉该主题的专家或爱好者撰写 。

RankBrain

RankBrain是一个人工智能系统,可以帮助我们理解单词与概念之间的关系。这意味着我们可以更好地返回相关内容,即使它不包含搜索中使用的所有确切词,通过了解内容与其他词和概念相关。(关键字并不重要,概念、意思到位最重要。)

可靠的信息系统

多个系统以各种方式工作以尽可能显示最可靠的信息,例如帮助显示更多权威页面和降低低质量内容 以及提升新闻质量。在可能缺乏可靠信息的情况下,我们的系统会自动显示 有关快速变化的主题的内容建议 ,或者当我们的系统对可用于搜索的结果的整体质量没有很高的信心时。这些提供了有关如何以可能导致更有用的结果的方式进行搜索的提示。详细了解我们在搜索中提供高质量信息的方法。(这是针对假新闻和不实信息的算法。)

站点多样性系统

我们的站点多样性系统有效,因此我们通常不会在我们的顶部结果中显示来自同一站点的两个以上网页列表,因此没有一个站点往往会主宰所有顶部结果。但是,如果我们的系统确定与特定搜索特别相关,我们可能仍会显示两个以上的结果。站点多样性通常将子域视为根域的一部分。如:来自子域 (subdomain.example.com) 和根域 (example.com) 的列表都将被视为来自同一个站点。但是,有时子域在被认为相关时出于多样性目的被视为单独的站点。(针对霸屏现象的算法。)

垃圾内容链接检测系统

没有人希望他们的电子邮件收件箱充满垃圾邮件,这就是垃圾邮件过滤器如此有用的原因。搜索面临着类似的挑战,因为互联网包含大量垃圾信息,如果不加以处理,我们将无法显示最有用和最相关的结果。我们采用一系列垃圾内容检测系统(包括SpamBrain)来处理违反我们垃圾信息政策的内容和行为。这些系统会不断更新,以跟上垃圾信息威胁发展的最新方式。

已退休系统

以下系统出于历史目的而注明。它们要么被纳入后续系统,要么成为我们核心排名系统的一部分。

蜂鸟

这是我们在 2013 年 8 月对整体排名系统做出的重大改进。从那时起,我们的排名系统一直在不断发展,就像它们之前一直在发展一样。(已经被BERT替代。)

移动友好的排名系统

在存在许多具有相对相等相关性的可能匹配 项的情况下,适合移动设备的排名系统会优先考虑在移动设备上呈现得更好的内容,因为适合移动设备的内容对于在这些设备上搜索的人更有用。该系统已被纳入我们的页面体验系统。

页面速度系统

该系统最初于2018 年宣布 为“速度更新”,这意味着当所有条件都相同时,为移动用户加载速度更快的内容将在我们的移动搜索结果中表现更好。它已成为我们页面体验系统的一部分。

熊猫系统

这是一个旨在更好地确保高质量和原创内容出现在我们的搜索结果中的系统。它于 2011 年宣布并获得“熊猫”的绰号,并在2015年发展并成为我们核心排名系统的一部分。(已经被原创系统、有用的内容系统、重复删除系统、垃圾内容链接检测系统等吸收。)

企鹅系统

这是一个旨在打击链接垃圾邮件的系统。它于2012 年发布,绰号“企鹅更新”,于 2016 年集成到我们的核心排名系统中。(已经被垃圾内容链接检测系统吸收。)

安全站点系统

该系统于2014年宣布,意味着当所有条件都相同时,使用HTTPS保护的网站在我们的排名系统中会表现更好。在HTTPS的使用还相当少见的时候,它帮助鼓励了安全站点的发展。它已成为我们页面体验系统的一部分。

Scroll to Top