ChatGPT阴影之下的谷歌Bard实测:珠玉在前

先笑一下,谷歌自己开发的人工智能工具,居然主张分拆谷歌阻止垄断?在反垄断的问题上,谷歌刚刚开放公测的生成式AI Bard相当地大义灭亲。本周二,谷歌宣布生成式AI Bard推出Beta测试版,逐步分批向注册的公众开放测试。但目前只面向美国和英国用户开放公测,而且暂时只支持英语。其他地区与语言的用户,需要等待Bard的后续更新。

(Bard居然支持分拆谷歌)

Bard公测姗姗来迟

虽然谷歌有着横跨诸多领域的漫长产品线,但Bard无疑是近年来最受关注也是最为重要的新品,更直接关系到未来几年谷歌的竞争力和市场前景。尽管谷歌2月初就已经公开展示Bard,但并没有开放公测,而是只向谷歌员工以及少数受邀的可信测试者开放内测。

2月初谷歌在展示Bard的过程中,出现了一个事实性错误(对韦伯天文望远镜的基础知识介绍错误)。尽管这个小错误相当专业,只有天文爱好者才能发现,但却依然拖累谷歌母公司股价大跌8%,一天时间市值蒸发了1000亿美元。

(谷歌CEO发送内部备忘录)
(谷歌CEO发送内部备忘录)

或许因为这个前车之鉴,谷歌高层对Bard的公测保持着非常谨慎的态度。在在开放公测之后,谷歌CEO皮查伊周二向员工发布内部备忘录称,“我们已经采取了负责的态度进行研发,包括邀请了不同背景和立场的1万名可信人士进行测试,我们也欢迎所有的反馈,从中学习,不断迭代和改善。”

看起来,皮查伊是在给Bard可能的纰漏打预防针。“即便在所有这些进展之后,我们依然处在漫长AI征途的起步阶段。随着越来越多的人开始使用Bard和测试性能,他们会给我带来惊奇,可能会出现问题。”

与此同时,谷歌也在淡化生成式AI对自己搜索业务的冲击,强调Bard并不是搜索引擎的取代产品,而是一个补充辅助。值得一提的是,Bard是单独的网页对话框,而不是作为谷歌搜索工具,但在回答之后会提供一个谷歌搜索按键。

ChapGPT施加重压

过去三个多月,科技行业最火的产品无疑是ChatGPT。OpenAI打造的这款生成式AI产品发布之后火遍全球,让用户感受到了前所未有的智能体验,更直接带动了下一个科技风口,甚至卷到中国互联网创投圈。

另一方面,互联网巨头微软不断加码战略投资OpenAI,将其牢牢绑在自己的Azure云平台上,在ChatGPT大火之后顺势接入自己的办公组件以及必应搜索,将AI定为自己产品的核心竞争力,又一次向占据搜索市场主导地位的谷歌发起冲击。

这股ChatGPT热潮的背后,最尴尬的莫过于行业巨头谷歌。尽管谷歌早在2015年就开始研发生成式AI,在2021年就发布了对话应用语言模式LAMDA,但一直在内部稳步研发。

去年6月,一位谷歌AI工程师号称LaMDA已经具有人类情感,虽然谷歌很快就将他调离工作岗位,但此事被媒体曝光之后,还是引发了不小的争议和猜测,更让谷歌对AI安全性保持谨慎,不愿仓促推出。

ChatGPT去年发布之后,AI项目负责人迪恩(Jeff Dean)在内部会议上表示,虽然谷歌也有类似的AI工具,但目前技术还不成熟,如果过于仓促推出产品,可能会影响谷歌的声誉,因为用户非常相信谷歌提供的信息。

然而,谷歌现在却不得不加快研发步伐,追赶竞争对手的产品。这并不是谷歌习惯的节奏。去年12月,谷歌将生成式AI的产品级别提升到最高的红色,协调公司内部AI研发资源,加快推出自己的应对产品。

实际上,谷歌在Bard的推进步伐上左右为难。如果研发动作迟缓,外界会担忧谷歌的竞争实力和行业前景,拖累股价低迷不振;但如果推进过于仓促,外界更会对Bard出现的纰漏感到失望,打压股价跌跌不休。这或许是皮查伊在Bard公测时频频打预防针的主要原因。

实时联网最大优势

那么,Bard的实际使用表现如何呢?

相比ChatGPT,Bard的最大优势是巨大的信息资源,他们可以依托谷歌的搜索工具获取最新信息,根据自己的梳理给出答案。此前ChatGPT的训练数据最新只到2021年,无法回答2022年之后的信息咨询。此外,Bard的回复速度也明显快于ChatGPT。

Bard可以联网搜索信息,意味着用户可以直接询问今天的体育比赛比分、股价价格走势、系列新闻动态。不过在实际测试中,我发现Bard还是存在着时间差,还没有做到完全实时。

但相对于ChatGPT的训练数据库,谷歌Bard的联网能力还是有着明显的优势,他们可以就最新事件给出自己的回答。当我询问美国前总统特朗普近期可能在纽约被起诉以及硅谷银行倒闭的情况时,Bard都给出了简单但是比较完整的事件梳理与总结。

(让Bard寻找餐厅)
(让Bard寻找餐厅)

帮助用户提供航班酒店订餐信息,对谷歌来说本就是分内之事。但Bard也会出现信息偏差。我周二要求Bard为自己定一张从加州圣何塞到北卡夏洛特飞行时间最短的机票时,Bard居然给出了一个完全错误的航班号。而当我周四再次询问Bard的时候,发现谷歌已经纠正了这个错误,给出了正确的航班号。

(ChatGPT支持第三方插件获取实时信息)
(ChatGPT支持第三方插件获取实时信息)

不过就在今天,OpenAI宣布通过认证安全的第三方插件,让ChatGPT在受控环境下接入实时信息,解决此前无法联网的最大痛点。第一批插件主要来自Expedia、Instacart、Shopity、Slack等服务平台,帮助用户获得生活以及协作类信息。这意味着ChatGPT也可以提供订餐订票,也可以检索公司文件和笔记信息。

大义灭亲分拆谷歌

(Bard写诗挺大白话的)
(Bard写诗挺大白话的)

做数学题、讲个笑话、写首情诗,这些对话操作对ChatGPT已经是小菜一碟,在Bard这里也是不在话下。在这些指令方面,Bard并没有太大的问题,甚至还能提供不同文本选择。Bard也允许用户复制文本。

(Bard回答如何安慰生病男孩)
(Bard回答如何安慰生病男孩)

在工作辅助方面,Bard同样也可以完成日常任务,帮助用户写商业邮件和简单文章,也可以做表格、做笔记、做分析,不过需要将文件上传到Google Drive。

(鸡兔同笼问题对Bard太简单了)
(鸡兔同笼问题对Bard太简单了)

虽然Bard网页端提供语音输入,但实际并无法使用;虽然Bard号称支持多种语言翻译,但实际使用却表示自己暂时无法完成指令。这些细节都表明Bard依然是个半成品,还需要后续完善。

(询问Bard对《瞬息全宇宙》的影评)
(询问Bard对《瞬息全宇宙》的影评)

个人不懂编程,无法亲身体验ChatGPT和Bard在编程能力方面的差别。但从身边程序员朋友的反馈来看,ChatGPT在这方面似乎更了解他们的需求,也不会帮助他们编程,“Bard不给码农需要的黑底语法高亮。在Python问题的回答质量也比ChatGPT差远了。”

Bard是有自己观点输出的。谷歌发言人在开放公测后表示,Bard这样的大语言模型(LLM)是根据公开内容进行训练的,他们会反映出对具体的政治人物、名人以及其他公众人物的正面或负面看法,甚至会在回答中给出对争议社会或政治问题的某些方面的观点。

不过,Bard很多时候并不显示信息源,因此准确性需要用户自行判断。换一个角度来看,用户并不清楚Bard是如何得出结论的,也存在被谷歌的算法误导而轻信其结论立场的可能。在美国社会严重割裂的情况下,这一点很可能会引发保守派的质疑。

有趣的是,当一位测试者询问Bard怎么看待美国司法部对谷歌的反垄断诉讼时,Bard居然立场鲜明地选择了“大义灭亲”。Bard义正言辞地指责“谷歌收购竞争对手,施压网站使用其工具,对其广告交易进行限制。这些措施损害了消费者,扼杀了数字广告市场的创新。我希望法庭认可司法部的诉求,下令谷歌采取措施打破垄断。”看起来,Bard并没有因为谷歌出品,就给予母公司特殊待遇,谷歌在最敏感的反垄断问题上,也没有干预Bard的看法。

AI军备竞赛升级

或许,如果Bard是去年年底先发布的生成式AI,那么Bard的表现足以引发一片赞叹,或许也会带动一波行业热潮。但Bard的公测时间比ChatGPT晚了整整四个月,在经历过此前体验ChatGPT的诸多惊喜之后,的确很难对Bard有新鲜感。Bard暂时还不支持其它语言,也不支持图片,不会编程,国际市场用户也不知道何时可以使用。

就在谷歌发布Bard公测版之前,OpenAI和微软已经掀起了新一波的AI军备竞赛。OpenAI前几天刚刚发布了新一代大型多模态模型GPT-4,接受图像和文本输入,提供文本输出,并接受了更多数据的训练(基于微软Azure平台),在模型文件中拥有更多的权重。用OpenAI的话来说,GPT-4已经在各种专业和学术基准上表现出人类的水平。

GPT-4的创造性和协作能力也超过了此前的诸多版本,高级推理能力超越了ChatGPT。根据OpenAI的介绍,已经安排GPT-4参加了美国律师资格考试、法学院入学考试以及美国高考SAT的数学与写作。在这些测试中,GPT-4的成绩超过了88%的应试者。

毫不意外,微软在第一时间推出了企业级Azure OpenAI GPT-4的预览版服务。企业可以根据Azure OpenAI服务来构建自己的应用程序。机器人开发人员只需要几分钟就可以以自然语言构建虚拟助手。

在这波生成式AI军备竞赛中,OpenAI无疑是暂时的领先者,无论是研发步伐还是智能程度,都快了谷歌一步;也让其战略合作伙伴微软看到了追赶谷歌的曙光。自从2月初必应接入ChatGPT以来,必应页面访问量增长了15.8%,应用全球下载量增长了8倍,日活用户更是突破了1亿人。与此同时,谷歌搜索页面访问量则下降了1%,搜索应用下载量减少了2%。

原本大局已定的搜索市场,也因为生成式AI技术的加持,又重新注入了竞争活力。不过,这并不意味着谷歌的市场地位即将动摇。谷歌搜索的日活用户依然是10多亿级别,是必应的十倍以上。如果谷歌尽快完善Bard的用户体验,向全球用户开放全面公测,支持多种语言,凭借着巨大的用户基数和数据优势,未来的AI军备竞赛依然格局难定。

(Bard眼中的的竞争对手)
(Bard眼中的的竞争对手)

最后我询问Bard,谁是其主要竞争对手。Bard列出了微软的小冰、OpenAI的GPT-3以及亚马逊的Lex。“这些模型都是基于大量文本和代码进行训练,可以生成文本,翻译语言,书写多种创意内容,回答用户的问题。但我相信自己通过谷歌搜索从现实世界获取和处理信息的独特能力,持续保持回复与搜索结果一致。从而能够以更为全面和更具信息地回答你的问题。”

原文链接: ChatGPT阴影之下的谷歌Bard实测:珠玉在前

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发
头像
说说你的看法!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容