快速导航
在今天的帖子中,我们从必应的 Ali Alvi Q&A / 特色片段团队负责人那里得到了内幕消息。
Alvi 的正式头衔是“Bing AI 产品首席项目经理”
读两遍,你就会很好地了解这次采访所包含的内容不仅仅是“只是”如何获得精选片段。
在播客采访期间,我希望深入了解 Bing 如何生成问答(谷歌语言中的特色片段)......
这意味着我在问他们如何从网络上数千亿个页面中提取任何问题的最佳答案。
我明白了。
还有更多。
问答 / 精选片段
首先(也是这次采访的理由)——我想与团队中的某个人进行一次信息丰富的聊天,该人致力于算法以产生最佳答案。 (应答引擎优化是我的事。)
说明(未精选的片段)
出乎意料的是,我还深入了解了生成在传统蓝色链接下使用的描述的算法。
原来,这两者有着密切的联系。
Alvi (under) 很好地说明了这一点——对于问答,谷歌使用了“特色片段”这个词。
因此,位于顶部、前面和中心的那些结果只是具有特色的蓝色链接片段。
很明显,一旦你完全理解了蓝色链接下方的文本不是“美化的元描述”,而是适应搜索查询的页面摘要。
为什么元描述不影响排名
元描述对排名没有影响。
为什么?
因为他们几年前将其转移到了不同的算法中。
可能当他们告诉我们他们不再考虑他们时。哦,天哪。
SEO 专家过度优化元描述。
其他人都没有提供一个。
无论哪种方式,网站所有者都做得不好。 🙂
Bing 和 Google 不能依赖我们准确地总结我们自己的页面。
现在您知道 Bing 在不喜欢您的元描述时如何创建“蓝色链接描述”。
问答/精选片段从他们创建的系统中产生出来,用于动态生成描述
因此,简而言之,我们在结果顶部看到的答案只是从我们的内容中提取 Bing 或 Google 的片段并加以展示。
Alvi 指出,他们并不是简单地“截取片段并展示它”。他们有时做的远不止这些。
他们可以(有时确实)构建文本语料库的摘要并展示这一点。
从文档中提取隐含问题
创建文档摘要是他们将文档中包含的答案与问题匹配的过程的一部分。
Bing 的用户提出一个问题(以搜索查询的形式),然后 Q&A 查看顶部的蓝色链接结果(使用 Turing)并创建一个摘要。
该摘要给出了文件隐含回答的问题。
确定最接近用户问题的隐含问题,宾果游戏,您拥有“最佳”答案/问答/精选片段。
根据 Alvi 的说法,他们正在使用雄心勃勃的人工智能,而这种人工智能在其他地方甚至在学术界都没有使用过。他们正在教机器如何阅读和理解。
图灵是问答的关键,但远不止这些……
图灵驱动片段,驱动问答......以及每个微软产品
“在 Bing 内部,我们有一群应用研究人员正在研究雄心勃勃的自然语言处理算法……”Alvi 说。
片段团队“是微软所有算法的中心”。
据我了解,这意味着驱动这些(看似无害的)描述的团队提供了理解文本语料库的算法,并提取或创建文本块进行显示——不仅适用于任何需要它的候选集,而且适用于任何平台或 Word 或 Excel 等软件。
从 SEO 的角度来看,这意味着使用机器学习(以 Bing 图灵的形式)来创建向用户显示的文本,从标题到描述到摘要到问题的答案……嗯,谁知道呢?
从更广泛的角度来看,SERP 描述的发展方式似乎将为它在微软生态系统其他地方的发展提供一个窗口。
一旦 Alvi 说出来,很明显这种技术必须高度集中化(这样我们就可以发挥我们的想象力并想出一些其他可能的例子)。
有趣的是,涵盖(或将涵盖)所有 Microsoft 产品的内容正在从十个蓝色链接的描述中转出给他们。
回到搜索算法的工作原理
搜索中的达尔文主义是一件事 – 100%
这次采访是我在听了 Google 的 Gary Illyes 的 Google 排名如何运作后写的文章的一个可爱的转义。
我曾问 Illyes 是否有针对特色片段的单独算法,他说“没有”……
蓝色链接有一个核心算法,所有候选集都以模块化方式使用它,以模块化方式对因素(或更准确地说,特征)应用不同的权重。
Alvi 表示“想法就是这样。”
在第一集中,Frédéric Dubut 证实了这一点,在第五集中,Nathan Chalmers(整页团队负责人)也证实了这一点,所以我们现在处于非常安全的状态:寻找中的达尔文主义是一个“东西”。
基金会永远是 10 个蓝色链接
Alvi 提出了一个很好的观点:搜索引擎在进化(哦哦,又是达尔文主义)。
从历史上看,在最初的 15 年左右,搜索引擎只有 10 个蓝色链接。
然后,当 Q&A 等新功能出现时,它们必须在不破坏核心的情况下适应原始系统。
简单的。
杰出的。
合乎逻辑。
问答:“排名靠前的蓝色链接的最佳答案”
问答算法只是简单地运行蓝色链接的顶部结果,看看它是否可以从一个文档中提取内容,当场就准确地回答了这个问题。
因此排名前 20 位左右是必要的(具体数字尚不清楚,几乎可以肯定会因具体情况而异)。
有一个有趣的例外(见下文)。
也许我们倾向于忘记使用 Bing 和 Google 的人信任他们。
作为用户,我们倾向于相信顶部的答案。这对于了解两家企业的运作方式至关重要。
对于两者来说,他们的用户实际上就是他们的客户。像任何企业一样,谷歌和必应必须为他们的客户服务。
这些客户想要并期望一个问题的简单答案,或一个问题的快速解决方案。
问答/精选片段是他们可以为客户提供的最简单、最快捷的解决方案。
Alvi 的部分工作是确保 Bing 提供的结果符合客户的期望、微软的企业形象和 Bing 的商业模式。
这是所有企业都面临的微妙平衡:
- 满足用户。
- 维护企业形象。
- 挣钱。
在问答(或任何与此相关的搜索结果)的情况下,这意味着为用户提供“最好、最方便的答案”,而不会被认为是错误的、有偏见的、误导性的、冒犯性的或其他任何东西。
怪癖:要获得问答场所,您不必在蓝色链接中排名
Alvi 表示,大多数时候,问答只是建立在蓝色链接之上。
但他们会记住他们显示的结果,有时会显示当前不在蓝色链接中的结果。
因此,您必须首先排名才能获得问答,但是由于问答有记忆,因此您不需要保持该蓝色链接排名以供将来考虑进行问答点。
问答的排名因素是什么?
专业知识、权威和信任。简单的。
必应使用术语“相关性”而不是专业知识。
他们的意思是准确性,与专业知识的概念相距一百万英里。
所以问答非常基于 E-A-T。
Google 和 Bing 正在关注我们的专业知识、权威和信任,因为他们想要展示“最佳”结果——那些让他们看起来专业、权威和值得用户信赖的结果。
现在,这没有意义吗?
这是寻找“最佳”的过程回答
该算法从相关性开始。
答案正确吗?
如果是这样,它就有机会。
任何文件的正确性取决于它是否符合公认的意见和文件的质量。
这两者都是由算法对实体及其关系的理解决定的(因此基于实体的搜索也是一回事)。
一旦一个实体被识别为答案的关键,神经网络就会确定该实体是否存在于这个答案中。
如果是这样,与其他相关实体相比的上下文是什么,以及该迷你知识图与“公认的事实”的对应程度如何。
然后,从那些相关的文件(或准确/正确/专家 - 选择您的版本)中,他们将查看权威和信任信号。
端到端神经网络评估文档、作者和出版商的显式和隐式权威和信任。
端到端神经网络
Alvi 坚持认为问答几乎是端到端的神经网络/机器学习。
和 Dubut 一样,他将算法视为简单的测量模型……
它衡量成功和失败并相应地调整自己。
衡量成功与失败:用户反馈
对于端到端的神经网络,人类拥有的控制权是他们输入的数据以及他们用来判断性能的指标。
他们不断地向机器提供我所说的“纠正数据”。
目的是向机器指示:
- 它在哪里做对了(杜布特谈到了学习中的强化)。
- 当它出错时(推动机器进行调整)。
大部分数据基于以下形式的用户反馈:
- 评委(相当于谷歌的质量评估员——杜布特在这里谈论他们)。
- 调查。
- 来自 SERP 的反馈。
Alvi 建议,这是如何评判机器的关键,也是如何评判团队本身的关键。
相关团队成员需要在内部做出回应。
算法背后团队的主要职责是创建一个可靠的算法,该算法生成的结果可以建立对搜索引擎的信任。
对我来说,这反映了在 Bing 或 Google 上搜索的人是他们的客户的想法。
像任何其他企业一样,他们的商业模式依赖于满足这些客户。
和任何其他企业一样,他们对使用客户反馈来改进产品非常感兴趣。
排名因素出局,指标入局
由于机器学习在排名过程中占主导地位,因此关键问题不是“因素是什么”,而是“指标是什么”。
排名的实际计算几乎变成了端到端的神经网络。
人类的任务是设置指标,进行质量控制,并提供干净的标记数据,以鼓励机器自我纠正。
机器用于满足该测量的因素是我们(和他们)无法知道的。
Bing 在生产中的模型具有数亿个参数。
任何人都无法真正进入并了解正在发生的事情。测量它的唯一方法是给它输入并测量输出。
我们可以给机器一组我们认为相关的因素。
但是一旦我们让他们了解数据,他们就会发现我们没有想到的因素。
Bing 或 Google 的人员不知道这些隐含/间接因素,因此询问他们是什么毫无意义。
他们最初认为重要的一些因素并不重要。
有些他们认为没什么大不了的。
他们还需要一些他们没有想到的东西。
所以要问的问题是“指标是什么”,因为这是产品团队可以控制的地方。这些是机器成功的衡量标准。
重要的是,机器将锁定指标所说的任何内容。
如果指标不正确,机器瞄准错误的目标,纠正数据(指令)会产生误导——最终机器会出错。
如果指标是正确的,整个过程有助于在良性循环中改善结果,并为 Bing 的客户改善结果。
Bing 产品是成功的。
过滤结果/护栏
由于团队是根据他们的算法产生的结果的质量来判断的,并且质量是根据这些结果提高 Bing 客户对 Bing 产品的信任度的能力来判断的,因此他们有一个过滤算法来防止“坏”结果损坏 Bing品牌。
该过滤器本身就是一种基于机器学习的算法。
一种过滤器,它学会识别和抑制任何无益、冒犯或损害 Bing 声誉的内容。例如:
- 仇恨言论。
- 成人内容。
- 假新闻。
- 攻击性语言。
过滤器不会更改所选候选人,而只是抑制对整页算法的出价。
Alvi 有趣地指出,他们只是行使了不回答给定问题的特权。
注释是关键
“Fabrice 和他的团队做了一些非常了不起的工作,我们实际上完全依赖这些工作”阿尔维说。
他接着说,如果没有 Canel 的注释,他们就无法构建算法来生成问答。
而这个系列表明这是一个适用于所有丰富元素的共同主题。
特别是对于问答,这些注释使算法能够轻松识别相关块,并允许它们进入并拉出适当的段落,无论它出现在文档中的任何位置(Cindy Krum 的“Fraggles”)。
在为蓝色链接重写元描述时,它们也是片段算法用来提取文档最合适部分的句柄。
这已经很酷了。但似乎 Canel 的注释比简单地识别块更进一步。
他们甚至提出了文档中不同块之间可能的关系,这极大地促进了将文档的多个部分中的文本组合在一起并将它们拼接在一起的任务。
因此,除了它所做的一切之外,Bingbot 还具有强大的语义标签作用。
这再次说明了我们构建页面并为 Bingbot(和 Googlebot)提供尽可能多的线索以便它可以为我们的 HTML 添加最丰富的注释层是多么重要,因为该注释极大地帮助了算法提取并充分利用我们(精彩的)内容。
问答引领潮流
问答在结果的顶部居中,它是所有其他微软产品使用的中心,也是必应和谷歌正在谈论的基于任务的旅程的核心,即搜索的未来。
问答/精选片段是真正突破界限的片段,并且是我们所有人的焦点和焦点:必应、谷歌、他们的用户以及作为搜索营销人员的我们——这激发了我这么说……
简而言之 SEO 策略
当我回听写这一系列文章的对话时,我感到这一切是多么紧密地结合在一起。
对我来说,现在很清楚,爬取、存储和排名结果的整个过程(无论是蓝色链接还是丰富的元素)都是相互依赖的。
而且,鉴于 Canel、Dubut、Alvi、Merchant 和 Chalmers 在本系列中分享的内容,我们的主要关注点可以有用地总结为:
- 结构化我们的内容,使其易于抓取、提取和注释。
- 确保我们的内容对作为我们受众的部分用户有价值。
- 在内容、作者和出版商级别构建 E-A-T。
无论我们要求 Bing(或 Google)向他们的用户展示什么内容——无论是蓝色链接还是丰富的元素,这都是真的。
阅读必应系列中的其他文章
- Bing 排名如何运作 – Bing 高级项目经理负责人 Frédéric Dubut
- Bing 的发现、抓取、提取和索引 – Fabrice Canel 必应首席项目经理
- 问答/精选片段算法的工作原理——Ali Alvi,Bing AI 产品首席项目经理
- 图像和视频算法的工作原理 – Meenaz Merchant,Bing 人工智能和研究首席项目经理负责人
- 整页算法的工作原理 – Nathan Chalmers,Bing 搜索相关性团队项目经理
图片来源
特色和后期图片:Véronique Barnard,Kalicube.pro