·“谷歌过去的丑闻、拙劣的发布动作和人才流失使它处于一个令人惊讶的位置:在它帮助创建的领域(搜索)中追赶。”
·“大型科技公司被迫采取行动,但技术还没有成熟。这项技术比一年前成熟得多,但还远未强大到足以跻身最前沿。”
人工智能(AI)聊天机器人巴德(Bard)回答错误,谷歌公司“被扣”1000亿美元。谷歌似乎在与微软的紧张竞争中失去了自己的节奏,仓促推出类ChatGPT技术只会增加错误风险。
2月7日,谷歌在宣布其类ChatGPT服务“巴德”时,在Twitter上发布了一个演示产品的GIF动图,结果被网友发现,巴德在回答关于哪颗卫星首先拍摄了地球太阳系外行星的照片时提供了错误答案。
回答出错被发现后,2月8日谷歌母公司Alphabet股价下跌超7%,市值蒸发约1000亿美元。这是Alphabet三个月来最大的股价跌幅。
当地时间2月8日,谷歌还在巴黎举行了一场发布会,展示其在人工智能方面的进展,但并没有如预期般详细介绍巴德的相关信息,仅对原有的人工智能产品做了一些更新和拓展,被评价为“苍白无力”。
如今,整个科技界都在注视谷歌“着急上火”的样子。彭博社发表题为“AI聊天机器人的伟大竞赛:人工?是的。智能?也许”的专栏文章,称微软的必应和谷歌的巴德肯定会犯错误,与谷歌合作的出版商也不会高兴。《福布斯》发表题为“‘人工智能第一’到最后:谷歌如何在人工智能热潮中落后”的文章,称谷歌过去的丑闻、拙劣的发布动作和人才流失使它处于一个令人惊讶的位置:在它帮助创建的领域(搜索)中追赶。
谷歌睡着了?
在上述动图中,巴德被提问“我可以告诉我9岁的孩子关于詹姆斯·韦伯太空望远镜 (JWST) 的哪些新发现?”
巴德给出了很多答案,其中一个暗示詹姆斯·韦伯太空望远镜被用来拍摄地球太阳系外行星的第一张照片。然而,第一张系外行星照片是由欧洲南方天文台的甚大望远镜(VLT)在2004年拍摄的,这一点已被美国宇航局证实。
DA Davidson高级软件分析师Gil Luria表示,“虽然谷歌在过去几年一直是AI创新的领导者,但他们似乎在将这项技术应用到他们的搜索产品上时睡着了。”
“谷歌过去几周一直在努力赶上搜索功能,这导致昨天(2月7日)匆忙宣布,并在其演示期间发布错误答案的尴尬混乱。”Luria说。
“人们开始质疑微软现在是否会成为谷歌真正赖以生存的业务的强大竞争对手。”持有Alphabet和微软股票的贝克大道财富管理公司首席策略师King Lip表示。Lip也警告称,对Alphabet的担忧可能被夸大了,“我认为必应与谷歌的搜索能力还差得很远。”
谷歌发言人表示,该错误凸显了“严格测试流程的重要性,我们本周将由受信任的测试人员启动这一过程”。“我们会将外部反馈与内部测试相结合,以确保巴德的回答在质量、安全性和全面性方面达到高标准。”
谷歌提出“正确答案不止一个”
自去年年底微软支持的OpenAI推出ChatGPT以来,谷歌一直承受着压力。ChatGPT在通过商学院考试、创作歌词和回答其他问题方面的能力,使其迅速成为病毒式传播的热门话题。2月8日,微软宣布推出支持聊天机器人的新版必应。(详见澎湃科技报道《“搜索领域新的一天”:微软推出支持聊天机器人的必应,可查最近事》)
谷歌也想方设法在这场竞争中获得领先地位,2月7日抢先公布了巴德。但在2月8日的巴黎发布会演示中,谷歌并没有详细说明如何以及何时将巴德整合到核心搜索功能中,仅对巴德进行了简短的演示,比如向聊天机器人询问有关购买电动汽车利弊的问题。与微软展示新版必应并提供有限公众访问权限相比,谷歌的功能演示并没有太多新意。
也许演示中最有趣的一点是,谷歌展示了它在未来将如何使用生成式人工智能从网络中总结信息。在演示中,谷歌展示了对“观星时最适合寻找的星座是什么?”这一问题的搜索。人工智能生成的回答突出了几个关键选项以及如何发现它们。
“新的生成式人工智能功能将帮助我们在搜索结果中组织复杂的信息和多个观点。”谷歌高级副总裁Prabhakar Raghavan说,“有了这个,你将能够快速了解全局,然后继续探索不同的角度。”
Raghavan将这种回应称为“NORA”回复,是no one right answer(正确答案不止一个)的首字母缩写。这似乎是在回应对AI生成内容的普遍批评——它们倾向于选择一个单一答案作为最终答案。但Raghavan没有具体说明该功能何时可用。
尽管谷歌是AI领域的领导者,多年来一直慢慢地将AI功能融入搜索中,但截至最近都没有推出ChatGPT的直接竞争对手。虽然刚刚推出巴德,但该系统目前仅在封闭测试版中进行测试,并承诺在“未来几周”的某个时候更广泛地向公众开放。
在直播演示中,谷歌演示向巴德询问有关购买电动汽车的利弊的问题。 图片来源:谷歌
在巴黎发布会上,谷歌宣布在用户超10亿的谷歌翻译上已经实现了翻译功能与AI技术的进一步整合。比如,英语、法语、德语、日语和西班牙语中具有多种含义的单词和短语,可以根据输入的上下文得到更准确的翻译。
除此之外,谷歌宣布之前推出的谷歌地图“沉浸式视图(Immersive View)”开始在伦敦、洛杉矶、纽约、旧金山和东京推出。该功能融合了数十亿张街景和航拍图像,打造了全世界的数字模型。通过AI技术神经辐射场(NeRF),它可以将普通图片转化为3D视图。用户能够查看天气、一天中不同时间的交通和车流等信息。
混乱且充满风险的竞争
在最近几周大科技公司裁员数万人并且承诺削减“登月项目”(指具有“登月”意义、造福人类社会的项目类别)后,ChatGPT似乎为科技业重新注入了活力。路透社发现,人工智能已经成为科技高管们的关注对象,他们在最近的财报电话会议上提到它的频率是前几个季度的六倍。
彭博社专栏作家Parmy Olson指出,对谷歌而言,推出类ChatGPT服务可能是它多年来最冒险的战略举措,就像从沙发上一跃而起,该公司已经在沙发上放松了太久。但谷歌和微软这两家一向行动迟缓的科技巨头间的这场争夺,将是混乱且充满风险的。
AI驱动的搜索的吸引力在于它可以用通俗易懂的语言显示结果,而不是列出大量令人眼花缭乱的链接,这可以使浏览速度更快、效率更高。但是,AI聊天机器人也给企业带来了一定风险,因为用于训练这些工具的数据中存在人类的固有偏见和虚假信息。尽管有严格的过滤器阻止机器人发表政治声明或仇恨言论,但社交媒体Reddit的用户已经想出了如何“越狱”迫使ChatGPT绕过安全规则发表违禁言论。
乍一看,谷歌似乎在如何使用新技术方面更加大胆。在微软发布的新版必应的示例中,聊天机器人的答案似乎将被降级到页面的一侧,而不是通常搜索结果的前面和中心,同时AI聊天机器人的回答还包括脚注和来源材料的链接,这使得该工具看起来更值得信赖。新必应的界面还包括对用户的警告:“让我们一起学习。必应由人工智能驱动,因此惊喜和错误是可能的。确保检查事实,并分享反馈,以便我们学习和改进!”
根据必应分享的一个例子,它的新聊天引擎答案出现在搜索页面的右侧。 图片来源:微软
相比之下,谷歌的巴德示例在页面中间、搜索结果上方显示了单一的摘要答案,并且没有脚注,这意味着用户不可能识别来源。为什么?这也许是因为谷歌面临着迅速行动的压力。根据《时代》杂志最近对DeepMind首席执行官Demis Hassabis的采访,该机构目前正在开发一个名为Sparrow的聊天机器人,将在其对查询的回答中引用消息来源,但谷歌的新工具并没有使用DeepMind的技术,至少现在还没有。DeepMind是谷歌母公司Alphabet旗下的研究实验室。
巴德的页面截图,在中间显示了它的合成答案,在其他来源的搜索结果之上,并且没有引用链接。 图片来源:谷歌
“大型科技公司被迫采取行动,但技术还没有成熟。”以色列初创公司AI21 Labs的联合创始人Ori Goshen表示,“这项技术比一年前成熟得多,但还远未强大到足以跻身最前沿。”AI21 Labs运营与OpenAI的GPT-3.5相互竞争的大语言模型。
OpenAI等公司试图通过增加参数和用于帮助预测单词的设置,来提高其语言模型的准确性,但把模型做大很多并不意味着它们会变得更准确,一些研究人员怀疑,随着模型的增长,准确性的回报会递减。对微软和谷歌来说,消除那些持续存在的少数错误可能会成为一项长期挑战,就像自动驾驶技术迄今为止“即将实现”一样。
谷歌还有可能破坏其与网络出版商的关系,这些出版商依赖谷歌的搜索页面为它们的网站带来点击。谷歌长期以来一直拥有相关技术,可以在多年前引入人工智能驱动的搜索查询答案,甚至早在2011年就谈到这样做,但从未这样做过,因为这会破坏其价值1500亿美元的业务。现在它被迫采取行动,可能会激起出版商的愤怒,尽管出版商也终将直面不可避免的技术进步。