穿着笔挺的白衬衫,李彦宏走上了舞台中央。
这一次,他要展示的产品万众瞩目。2023年2月,百度正式宣布生成式AI产品“文心一言”即将到来,这也是全球第一家官宣类ChatGPT产品的大厂。短短的一个月后,激动人心的一刻终于来临。
将时间重新回溯,从2022年11月ChatGPT的发布开始,生成式AI就成为了全球最热门的词汇,对整个业界来说,属于AI的时代奇点已经到来。在中国,深耕AI领域多年的百度自然成为了最受关注的企业。<;;;;;?XML:NAMESPACE PREFIX = "O" />;;;;;<;;;;?XML:NAMESPACE PREFIX = "O" />;;;;<;;;?XML:NAMESPACE PREFIX = "O" />;;;<;;?XML:NAMESPACE PREFIX = "O" />;;<;?XML:NAMESPACE PREFIX = "O" />;<?XML:NAMESPACE PREFIX = "O" />
在这个见证历史的时刻,刺猬公社也来到了文心一言新闻发布会的现场。答卷缓缓展开,在李彦宏的操作之下,文心一言简洁干净的界面吸引了全场的注意力,5个Demo的问答来回之际,百度也再度证明了自己的实力:某种程度上文心一言已经具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。
如果要跟ChatGPT对标,毫无疑问,百度已经拥有了站上舞台的实力。
文心一言,最擅长中文的生成式AI产品
如果说 GPT4在英文 对话 上无人可出其右,那么,文心一言绝对是生成式 AI产品中最擅长中文的。
“洛阳纸贵是什么意思?”在新闻发布会上,李彦宏向文心一言提出了这个问题,文心一言解答了这一成语的来源,讲述了左思《三都赋》的故事,它还讲解了“洛阳纸贵”背后的经济学原理。在问答的最后,文心一言还根据李彦宏的要求写出了一首包含洛阳纸贵的藏头诗。
从理解“洛阳纸贵”到理解“藏头诗”,文心一言充分体现了对中文文本的理解能力。对于当下的生成式AI产品来讲,解读问题中的文化内涵绝对是难点。
刺猬公社也在新闻发布会后收到了文心一言的测试邀请码,与它展开了一场对话。“什么是庄周梦蝶?”“这句成语包含了怎样的思想”,文心一言都给出了不错的答案,它将庄周梦蝶延伸出了新的含义“任何事情都有美好与丑陋的两重性,就看每个人的想法对待如何。”
文心一言最后还给出了一些建议:“人生是美好的,要把他看成一首诗,徜徉在人生的风景中,要像蝴蝶一样,美丽自己,美丽心情,用审美去悦读人生,用快乐去拥抱世界。”对比ChatGPT等产品,文心一言对于中国文化的理解达到了惊人的高度。通过百度搜索引擎以及十数年的中文语料内容积累,文心一言不仅能回答还能“融会贯通”,这一点是大多数生成式AI产品难以企及的。
但百度的期待远不止如此。在现场演示Demo中,文心一言同样体现了自己多元的语言理解能力。
对于生成式AI产品来说,能够实现精准高效的连续对话,是必备的素质之一。在演示中,李彦宏向文心一言提问了小说《三体》的相关问题,在连续六轮的对话中,相继回答了“《三体》作者是哪里人”“《三体》电视剧的演员是谁”“《三体》的核心内容”等几个事实性问题,借助百度搜索业务的深厚基础,准确无误的回答出了这些信息。
更难得的是,文心一言还拥有较强的总结、分析能力,“张鲁一和于和伟的共同点”“张鲁一和于和伟谁更高”,看似简单的两个问题,事实上对于产品的推理能力要求极高,首先文心一言需要搜集到问题相关的事实信息,同时要理解“共同点”“谁更高”的对比含义,并根据事实信息作出判断。
相比目前一些生成式AI产品的“胡编乱造”,文心一言能够在短时间能迅速实现对数据的搜集、推理、总结,并给予精准的回复,这样的表现已经足够令人惊喜。
根据百度CTO王海峰的介绍,在文心一言的关键技术中,知识增强、检索增强是百度已有技术优势的再次创新。通过知识内化和知识外用,文心一言能够实现对大规模数据的学习,同时引入外部多源异构知识,做知识推理、提示构建。因此在总结、归纳性的问题上,文心一言能够实现足够好的效果,检索增强则能够进一步加持回答的时效性、准确性,这也是其能够了解《三体》的关键。
文心一言还很擅长商业文案写作,能够根据要求为商业公司起名字、设计Slogan,甚至能根据名字、Slogan以及要求迅速撰写出一篇详尽的新闻稿。这不仅体现出了文心一言强大的创作能力,更能凸显文心一言的语言处理能力。
文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,以及百亿级语音日均调用数据,在5500亿事实的知识图谱的训练下,文心一言能够实现“读万卷书”的效果,不断锻炼自己的各项能力。
它还很擅长做数学题,在实际应用中,能够通过较高的数学逻辑推理能力解答复杂的数学问题,能够将鸡兔同笼等类似的问题拆解开来,一步步的进行解答与归纳,就如同锻炼人类的思维一样,AI也在类似的锻炼中不断演化。
在GPT-4发布之时,人们震惊于它强大的多模态交互,通过一张图片即能生成网站堪称奇观。而文心一言不仅在中文内容上有优势,在多模态能力上也是“人有我优”,不同于GPT-4的多模态输入,文心一言能够做到多模态输出,输入你的需求,便能及时生成图片海报,还能将答案转化为语音。
刺猬公社也进行了类似的尝试,在“生成一张熊猫爬树的漫画图片”的指令下,文心一言给出了一张质量较高的画作,画面上的熊猫憨态可掬。
最令人惊喜的无疑是其生成视频的能力。在李彦宏的演示中,文心一言在极短的时间内就根据自己创作的一段文案生成了一条近两分钟的短视频,视频内容也是完整流畅的。尽管由于成本问题该功能暂时不会开放,但百度仍旧展示了自己的独特优势:在文本生成的基础上,文心一言还能通过多元的内容创作满足市场需求。
换句话说,伴随产品能力的进一步成熟,在未来,拥有了一个文心一言,用户就拥有了一个强大的内容创作团队,不仅能写答案,还能写稿子、做视频。
为什么是百度?
必须要承认的一点是,通过文心一言的这场新闻发布会,我们能看到百度的真诚。
“最近一段时间,有很多朋友问我,为什么是今天,你们真的ready了吗?”面对这样的疑问,在李彦宏并没有掩饰产品的真实情况。“也不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标CGT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。”
如果说不以营利为目的的OpenAI是“集硅谷之力”,从而实现ChatGPT的横空出世,那么百度作为一家拥有营业压力的巨型企业,是如何在全球大厂中脱颖而出,成为第一个开放产品测试的“头号玩家”的?
李彦宏的这句话其实就是答案:“从某种意义上说我们已经为此准备了多年,我们十几年前就开始投入AI研究,2019年就推出了文心大语言模型,今天的文心一言是过去多年努力的延续。”
可以说从正式决定发力AI开始,文心一言就已经开始了“筹备”。一场新闻发布会背后,从NLP技术发展,到建立大模型,再到应用化落地,百度历经了十余年的战略布局、研发、产业实践,十年磨一剑,并不只是一句空话。
从2010年百度CTO王海峰成立自然语言处理部开始,百度便将AI应用到了各项业务之中,无论是搜索引擎、智能云还是自动驾驶,都在百度的AI战略加持下迎来了飞速发展。
在国内乃至全球科技公司中,百度对于AI技术的研发及应用都是处在世界前列的,这不仅代表着千亿级别的成本投入,还蕴含着成千上万AI人才的努力。光是在2022 年,百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%,实打实地“烧钱”之下,百度也逐渐建立起了足够强的技术优势。
文心一言的研发,事实上是对百度AI技术的进一步延续。根据李彦宏的介绍,在人工智能到来之际,IT技术栈发生了根本性的变化,从此前的三层已经扩展到了“芯片-框架-模型-应用”四层结构,而百度则是全球少有的在四层技术栈中都拥有领先产品的公司,这也是能够研发出文心一言的核心优势。
芯片层,百度自研AI芯片“昆仑芯” 起到“打底”的作用。目前昆仑芯已在多场景实际部署几万片,拥有较强的性能保障,能够保证文心一言的底层算力;在框架层,百度的飞桨深度学习平台也经过了多年的发展升级,为了支持千亿参数模型的高效分布式训练,百度飞桨在2021年4月专门研发了4D混合并行技术,从而助力超大规模模型的训练和推理。
在关键的模型层,百度于2019年就推出了文心大模型。目前已经升级到了ERNIE 3.0阶段,每天接受数十亿用户的搜索请求和其他百度移动生态App的训练。伴随着用户的扩大与训练量的增加,数据池还在进一步扩大。在文心大模型与飞桨平台的协同作用下,百度AI已经实现了多个领域产业级的应用。
百度搜索服务也在不断加持AI技术的发展,每天几十亿次的用户响应,1万亿次的深度语义推理与匹配,在实际使用中为AI能够提供最真实、最及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。
正如李彦宏所言,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
在技术角度的宣讲中,王海峰也表达了类似的观点,他进一步解析了百度在产业实践和技术积累上的优势,从大模型和深度学习平台的角度,进一步解答了百度的AI产品策略。可以说,文心一言的出现并不是心血来潮,而是水到渠成,放眼全球,百度是当之无愧的“头号玩家”。
不止AI,还有未来
文心一言 开放邀请测试 的前一天, GPT-4的发布引人注目,对于很多关注者来说,一个问题是需要解答的:文心一言真的是跟风之作吗?
新闻发布会现场,李彦宏也解答了这个问题:“为什么是今天?因为市场有需求。”在他看来,百度开发文心一言是市场的需要,更是时代发展的要求。“文心一言这样的大语言模型,会成为每个人必不可少的生产力工具。”
从百度自身发展的角度来讲,生成式AI产品的意义就是非凡的,无论从智能云还是自动驾驶,都有实际的落地需要,百度基础的搜索服务更不必说,NewBeing的火热已经证明了C端的强大需求。而更重要的则是外部市场,在百度宣布文心一言之后的短短一个月里,已有超过650家企业宣布接入文心一言生态。
“文心一言对个人的改变也会是巨大的,有机构预测,到2030年,人工智能可以将每一个知识工作者的生产力提高4倍以上。很多人的工作性质会发生不可逆转的改变。”在李彦宏看来,文心一言这样的AI产品不仅能改变许多岗位的生产方式,还能为多领域的企业机构提供新的发展动力。以百度为例,在过去的几年里,文心大模型已经实时投入进金融、交通、工农业生产等多重领域,深刻的提升了生产服务效率。
文心一言的多元应用场景与低门槛则能带来更多机会。“由于它超强的自然语言理解和表达能力,它让任何公司都有机会离自己的客户更近,有机会通过这些能力去创建最好的客户体验,从而比其他人更能抓住客户,获得更强的竞争优势。”
这也是650多家企业蜂拥而至的深层原因:文心一言的核心竞争力在于推动企业智能化变革的能力,或者说,改变未来生产的能力。基于文心一言的大语言模型优势,企业能够抢先开发重要的应用服务。
李彦宏也作出了预测,他认为文心一言引领的大模型时代将会为三大产业带来机会:
第一类是新型云计算公司。文心一言将根本性地改变云计算行业的游戏规则,Maas的发展将会成为衡量一家云计算公司能力的核心要素,客户将更看重全栈的AI能力。以百度智能云为例,在未来文心一言就将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,帮助多元行业提升工作效率,形成新的产业空间。
二则是进行行业模型精调的公司。据李彦宏解析,这些公司处于模型层与应用层的中间位置,他们未来能够通过调用大模型能力为行业客户提供服务,简单来说,大模型是通用的,而这些公司则依据垂直场景化的服务对大模型进行调整,从而为客户的实际应用提供服务。
最后则是基于大模型底座进行应用开发的公司,即应用服务提供商。在AIGC飞速发展的前景下,已经出现大量的相关创业公司,未来必然会涌现出一批优质的明星企业。李彦宏坦言,在这个阶段,每一家企业都有成为未来独角兽的能力。
AI赋能,不只是说说而已,“我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。”对于百度和整个行业来说,文心一言开放邀请测试,才只是个开端。
3月16日的新闻发布会结束后,部分用户已经能够实时体验文心一言的效果,其也将通过真实的人类反馈进行实时训练。刺猬公社让文心一言多次生成了歌词、诗歌等内容,其回答也越来越“精致”。
成千上万次的问答、对话、创作,将促进大语言模型飞速迭代。在与用户的实际交互中,文心一言将实现进化般的发展。
“士别三日,当刮目相看。”李彦宏对文心一言说出了这样的期许。无论如何,百度,或者说国内科技企业的第一步已经迈出,我们只是需要更多的时间,见证AI的飞轮旋转起来。那是创新驱动的新时代,科技将改变我们的人生。
来源:刺猬公社