见证巨人跌倒!ChatGPT和谷歌开启了第一场对决,结果是谷歌败下阵来

微软与Google围绕ChatGPT 的这场龙争虎斗,以出人意料的方式揭开了第一季的结局。

2月8日晚上,Google在巴黎举行AI 发表会,向外界正式披露聊天机器人产品Bard。作为ChatGPT 最重要的挑战者,Google过去两周一直在为这场发表会造势,但万众瞩目的产品示范时却出了重大纰漏——Bard 在回答「詹姆斯‧韦伯太空望远镜的新发现」这个简单问题时,错误地把另一个望远镜取得的成就安给了前者。

Google的股价在盘后大跌7.4%,市值一夜蒸发近千亿美元。形成鲜明对比的是:投资OpenAI 数十亿美元的微软,半天前刚刚举行了一场小型媒体活动,发表整合最新版模型的搜索引擎New Bing 和新版浏览器Edge,微软在过去两天上涨近4%,市值重回2 兆美元,并在Google翻车、全球ChatGPT 概念回档之际,盘后继续微涨0.5%。

将Google卷入这场生成式AI 大战,微软毫不掩饰自己的想法。 「我们的创新,将让Google come out and dance。我们想让人们知道,是我们让他们dance。」微软总裁纳德拉直言。

微软的尝试取得了成果,除了市值上涨,AI 功能的加入也如他们预期般,看到了撕开Google搜索引擎长城的曙光。新版功能小范围开启试用后,Bing 已经跃居至iOS 免费榜的第12 位,根据data.ai 的初步估计,Bing App 的新下载量增长了10 倍。

但这场围绕ChatGPT 的生成式AI 战争才刚开始,聊天机器人能否动摇搜索引擎的市场格局还有待时间观察。此外,围绕大模型的竞争也不止于搜索引擎,今天人们正在使用的大部分软体和服务都有可能被生成式AI 重塑,更多产品和服务都会被卷入其中。

甚至更进一步,随着类ChatGPT 以及更广泛的AI 能力需求的增加,对微软、Google、阿里、百度等所有的云端服务平台提供商而言,生成式AI 相关能力将成为重要的基础设施,围绕后者的竞争,将成为未来数年改变云端服务市场的X 因素。

先后发表新产品,Google跌了,微软涨了

上一次科技巨头之间这种拔刀互砍,还要追溯到疫情前TikTok 掀起的短影音大战。 ChatGPT 爆火后,资本、创业者和科技巨头纷纷卷入,科技圈的热闹恍如隔世。

打响第一场白刃战的是Google和微软,主题是搜索引擎。 2 月2 日Google宣布,8 号将举行现场发表会,介绍有关搜索引擎的最新产品。一周内,先是微软短暂上线疑似「整合GPT-4 的Bing 搜索版本」激起人们的好奇,随后Google总裁Pichai于2月6日公布了用于搜索服务的聊天机器人Bard,同一天,微软公布要在Google发表会的前一天7 号举行发表会,介绍最新的搜索引擎New Bing 和浏览器Edge。

「这是搜索的新一页,新的典范已经出现,军备竞赛从今天开始。」发表会上,纳德拉充满信心地宣布。 ChatGPT 走红后,业界很快意识到,大语言模型对于更新搜索产品的临界点到来了。在最新的产品发布中,Google和微软共同强调了这一点:以自然语言提问查询,AI 基于多方资讯、返送重新创作后的针对性回答。使用者还可以基于首轮回答,再进行追问。

两家都给出了购物场景下的查询案例。

比如Google:我想为家庭买一辆新车,应该考虑些什么? Bard 会建议你考虑预算、座位数、设计特点、安全性、动力类型几个维度。接下来,你可以追问,如果想买一个电动车型,有什么优势和不足?

还可以将对话的主题从选车,转移到旅行计画。你可以接着问Bard:第一次长途自驾将会从旧金山到圣塔克鲁兹,沿途有什么停车点?

对比之下,微软展示的产品体验则更完善。

在微软的示范中,给出了挑选电视的例子。当你在搜索引擎中输入「最好的65 英尺电视」,Bing 就会为你罗列出不同的产品。在展示形式上,Bing 的回答会在页面的右边栏框中,这样确保使用者可以同时看到传统搜索引擎给出的连结、以及生成式语言模型给出的综合回答。这也是微软所谓的「副驾驶」体验。

当想进行追问,则可以从「chat」选项切入,进入对话介面。基于已有的答案进行追问:哪一款最适合游戏?在给出的回答中,也可以继续追问,哪一款最便宜?

从产品的形态设计上而言,微软更为完备,考虑到了问答与传统搜索模式之间的自由切换。而Google目前仅仅展示了问答部分的产品形态。

更关键的部分在于,在Demo 的展示中,微软显示了资讯来源,以脚注和「Learn More」的形式供使用者核实与进一步了解。在Google的Demo 示范中则没有这个部分。

此外,Google还展示了向Bard 提问开放式问题。例如:观星时最好的星座是什么?搜索顶部的位置也会返回产生一段答案,同样没有显示资讯来源。

这带来的隐患是,当答案里有资讯错误时,更难以核查。 Pichai 在Google部落格中展示的第一个Demo,就出现了这样的问题。回答「怎样向9 岁的孩子解释詹姆斯‧韦伯太空望远镜的新发现?」时,Bard 称韦伯望远镜拍摄到了首张地外行星的照片。这就是一个事实性错误,这一成就实际上来自2004 年的智利大型望远镜;此外,第一条中「2023 年,韦伯望远镜发现了大量昵称为『绿豌豆』的星系」的时间也出现了错误,应该是2022 年7 月。

这样的事实性错误,ChatGPT 经常犯,如今出现在了为Bard 提供技术支援的LamDA。这种错误,成为搜索引擎的服务时,就会影响到使用者对产品的信任。因为没有资讯来源,使用者也无法透过核对发现错误。产品Demo 中出一次生成答案就出现两次错误,给使用者带来了强烈的不良观感。

而没有显示引用来源,也招致了搜索引擎产的行业人士对目前产品形态的不满。 「引用必须要有,希望这不是Google前进的方向,这样不对」,「在目前的实验形式中,我没有看到任何的归因或引用,没有连结,没有点击。这是对出版商的战争……」两位行业人士评论道。

真实产品与期待值的落差,致使Google盘后大跌。但这也是今天聊天式机器人产品需要面对的现实,甚至从某种意义上来说,在语言大模型积累多年的Google,即使将最新功能加入搜索产品,还有许多影响使用者体验的问题需要解决。

Google的谨慎与无奈

从目前更新的产品形态上来看,Google落后微软。而从之前传出的Picha 在内部发起「红色警报」(Red code)、搜索引擎两位创始人重回公司商讨AI 战略等消息来看,Google的确是在ChatGPT 大红之后,调整策略,紧急迎战。

ChatGPT 的爆红,让公众形成了印象,这是目前最先进的技术。但是在学术界则认为,ChatGPT 并没有在技术上领先很多。

乔治亚理工学院的电脑教授、机器学习专家Mark Riedl 对媒体表示,ChatGPT 背后的技术并不一定比Google和Meta 更好。但OpenAI 公开语言模型,让公众使用这一行为,带来了极大优势。

深度学习三巨头之一、Meta 研究院院长LeCun 对媒体表示:「(ChatGPT)这不是什么革命性的东西,尽管公众是这么认为的」,「这是很好的组合,这是很好的做法。」不仅如此,刚刚离职的OpenAI 的前产品负责人Fraser 表示赞同LeCun 的观点,并说「这本不该引起争议」。

LeCun 在Twitter 上解释,「我不是批评Open AI 的工作和他们的主张。我试图纠正公众和媒体的看法,他们认为ChatGPT 是一个令人难以置信的全新的、创新的、独特的技术突破,远远领先于其他所有人,事实并非如此。」

大公司差不多同时期开始研究语言大模型。第一个重要的技术突破是2017 年Google的神经网路架构Transformer,这也是从去年开始爆红的生成式AI 模型所用到的底层技术。Transformer 能够让机器在处理语言资讯时关注单词之间的联系,并预测接下来会是什么单词。这大大增强了模型对于语言的理解能力。

▲ 2017 年的Transform 网路论文,成员大部分来自Google|来源:arXiv

随后,Google于2018 年发表了预训练大模型BERT;2021 年,OpenAI 发布了预训练模型GPT-3,已经表现出了很强的写作、对话能力,但也表现出致命缺陷,就是「口无遮拦」,会生产极端种族主义、暴力等相关的内容;同年,Google发布了预训练模型LamDA,也显示出了良好的对话能力。

ChatGPT 最初的项目名称为「Chat with GPT-3.5」,是在GPT-3 与即将发表的GPT-4 之间,OpenAI 因为担心对手公司提前发表聊天机器人ChatBot,而临时确定的专案。工作人员接到的任务是,在两周之内快速发表一个聊天机器人。让所有人惊讶的是,它能在短时间吸引如此多的使用者,并加速了AI进入搜索产品的进程,随之引发了Google与微软间的较量。

ChatGPT 走红不久,Google内部便开始担忧了起来。「对于Google来说,这是一次错失良机吗,毕竟我们已经拥有LamDA 一段时间了。」

12 月初的内部会议上,这个问题为员工们所关注。那时,Google AI 部门主管杰夫・迪恩(Jeff Dean) 表示,Google拥有类似能力,但如果出现问题,代价将更高,因为人们必须相信从Google得到的答案。在技术公开和产品化上一直行为保守,对声誉风险的担忧是重要因素。

Google员工们表示,多年来,员工一直在提议将聊天功能加入搜索,这也是很明显的演变趋势。但是Google有充分的理由不着急反覆运算,不仅仅因为返送更有针对性的回答会减少广告空间。而是如果Google提供的聊天机器人给出一个不健康或者抄袭而来的答案,就会增加责任风险。而就外部环境而言,Google这几年一直面临反垄断审查或诉讼,再增加这样的道德风险绝对会带来更大压力。

如今,像墨菲定律起作用一样,Bard 所犯的错误,恰恰是Google原先所担心的问题,并在Google与微软第一次亮相比拼中,带来了负面效应。在技术封装进产品这一步上,Google因前期保守、仓促应战而落后。

摩根史坦利的分析师Brian Nowak 表示,语言模型可能抢占市场占有率,并扰乱Google作为网际网路使用者入口的地位。从Bing App 下载量增长10 倍来看,这个担忧绝对不是空穴来风。但基于Google的技术储备,他也表示,期待Google更多的产品表现。

搜索引擎战之下,AI 成为战略重心

无论是微软还是Google,目前两家发表的新产品尚未完全放开使用。微软的New Bing 需要登记WaitList,等待功能发放。而Google的Bard 目前仅开放给受信任的测试人员,在这之后,将是依托LaMDA 羽量级模型版本发布。 「在未来几周,我们会继续向更广泛的公众开放此服务。」Pichai 在部落格文章中写道。

因此,产品模型仅仅是做了示范,还没有大规模发放到使用者手中体验。之前人们所关心的问题,比如胡说八道、大规模使用的成本问题,目前还只停留在讨论阶段。

成本是必然需要面对的因素。据了解,Google未来会优先使用羽量级版本的LamDA,就是出于运算成本的考虑。

此前,OpenAI CEO Altman 表示,ChatGPT 回复一次的成本为几美分。 Brian Nowak 估计,ChatGPT 每次查询的成本约为Google每次传统搜索查询成本的7 倍,如果依托微软的云端服务Azure 提供最低价,可以降低到传统搜索成本的4 倍。考虑到搜索是一个日均百亿级使用次数的高频行为,长期运行,潜在的成本增加是一个天文数字。

微软官方披露,这次的New Bing 背后驱动的是下一代语言模型,比ChatGPT 更强大,也是专门为搜索制定的。在发表会后的问答环节,对于成本问题,微软的态度也很干脆,「我不打算回答这个。」对于模型胡编乱造的问题,回应则是「我们从一开始就在做这件事。我们正在衡量该模型在搜索结果中哪些地方没有站稳脚跟,但它并不完美。」

纳德拉说,「AI 将从根本上改变每一个软体服务类别,从最大的软体服务类别——搜索开始。」搜索引擎的变革刚刚开启,依旧有许多尾部问题需要花费时间解决。从产业角度而言,它或许意味着,以大模型为基础,AI 进入了全新的阶段。这或许是微软、Google、Meta 甚至苹果,以及中国的阿里、百度都在战略层面开始规划的原因。

目前,Google和微软都处于类似的时期,主要业务疲软。前不久,两家都交出了一份不太理想的2023Q2 财报,接下来业务增长的预期也不高。 Google广告收入出现上市以来第二次下滑,云端业务虽然保持两位数增长,但同期对比增速正逐季回落。微软主要的Office 和Azure 业务增速都在放缓。整体业绩疲软,收入增速为2%,持续下滑。纳德拉表示,微软在2022 年末就面临着核心业务Windows+Office 的业绩下滑。

与此同时,两家都在财报电话会上强调了AI作为战略的重要性。

Google表示,从下个季度开始,其研究机构DeepMind 的财务状况将单独列出,体现在季报中。 「AI 已经成为Alphabet 的战略重心,我们也看到AI 领域潜藏的巨大机遇。目前DeepMind 的研发领域将成为Alphabet 未来产品组合的核心。」前不久,Google便通过投资Anthropic 3 亿美元,成为其云供应商。

微软主要强调了在过去的三年多时间里,微软致力于训练超算、打造推理基础设施,为未来AI 进入应用程式做准备。也就是意味着,微软的云端设施和服务,需要嵌入更强的AI 能力,「对于Azure 来说,AI 将是其核心组成部分」、「我们希望为大家提供的也远不止Azure OpenAI 服务。如何将OpenAI 与微软的Azure Synapse 分析服务相结合等,都在我们的考虑范围之中。」

不难看出,无论是Google还是微软,都将会以大模型为基础设施,加快产业布局,其中的重要部分包括嵌入AI 能力的云端设施、基于大模型的API。 Forrester Research 公司AI 分析师Rowan Curran 表示,微软可以利用目前与Open AI 的合作与热度,获得更重要的短期回报,这便是扩大Azure 、OpenAI API 及更广泛AI 和机器学习平台的需求。

长期来看,当搜索产品大规模上线,稳定提供服务,可靠性和成本将成为更重要的影响因素,这也将考验双方基础设施的能力。

大模型领域独角兽Stability AI 的创始人Emad 曾表示,ChatGPT 将打败Google的故事听起来有点愚蠢。因为Google拥有最好的LLM(语言大模型)全套团队和定制晶片,没有竞争对手可以在创新、成本、或者市场上和其较量。这些基础设施包括PalM(单项语言模型)、LAMDA、Chinchilla(少量参数语言模型)、MUM(多工统一模型)、TPU 等。

很明显,Google首战的表现出乎了所有人的预料。面对有OpenAI 的模型能力加持、来势汹汹的微软,全世界见证了一场巨人的跌倒。

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发
头像
说说你的看法!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容