文|略大参考 杨知潮
编辑|原野
ChatGPT概念股“击鼓传花”的游戏,如今传到了知乎手里。
2月8日,内容社区知乎股价暴涨接近50%,创下历史新高。随着ChatGPT概念股在本周持续走热,包括百度、寺库、云从科技、汉王科技在内的多家公司,纷纷吃上红利。
不过,乱花渐入迷人眼。喧嚣中,有货真价实者,也有滥竽充数者,时间自然会将它们区分。
毕竟,ChatGPT虽新,但AI是个老概念了。在过去很长时间里,它都在以5-10年为周期经历着波动:在过去的很长时间里,每隔5-10年,人工智能的发展都会经历这样的周期:某个现象级的产品,让大家惊呼“人工智能的春天”来了,密集的媒体炒作与企业承诺随之而来。但热度散去之后,寒冬又会笼罩到整个行业,直到下一个现象级产品的出现。
很难说,ChatGPT就能打破这样的周期。对于跻身ChatGPT概念股的商业公司,同样如此。对待AI技术的不同态度,可能会把它们带向不同的未来。
01 井喷的ChatGPT概念股
很显然,ChatGPT让全世界的科技企业都急了。
比如微软老对头谷歌刚刚开了一场反省大会,反思以AI技术领先著称的谷歌为何没能先做出类似的产品,还加急推出了对标产品Bard。第二天,微软就宣布,必应接入ChatGPT,对谷歌的老本行搜索发起挑战。
微软和谷歌打得激烈,大洋彼岸,ChatGPT概念股成为了热门话题。
很多企业都在试图“上车”,把自家业务与 ChatGPT 搭上关系。以AI企业标榜的百度宣布,将在今年3月推出大模型“文心一言”。老牌互联网公司360表示,已经对类ChatGPT技术进行研究,并且有可能带来颠覆性的革新。就连做奢侈品生意的寺库,也宣布对相关技术进行研究——反正,只要你敢信,我就敢说。
因为热度带来的收益足够明显。科大讯飞在2月6日股价大涨近10%,相比年初上涨约三分之一。360股价涨停。百度港股单日暴涨约15%。2月7日当天,AIGC概念版块整体涨幅一度高达4%。
其中,以“四小龙”为代表的AI企业最受关注,受益也最明显。短短一周左右,云从科技累计上涨近70%,年内涨幅超过了100%,商汤科技上涨近30%。其他AI企业,比如汉王科技,也累计上涨超过60%。
对于股价低靡依旧的AI企业,这无异于久旱逢甘露。前面我们提到,AI技术发展具备极强的周期性,几乎每隔5-10年就能出现一个现象级的产品,带来春天般的繁华,但它往往难以持续,行业总会在热闹过后便陷入寂静,直到下一个产品的出现。
最近的一次出现在7年前。2016年,横空出世的阿尔法狗在全球范围内掀起AI热。国内AI企业如雨后春笋般涌现,估值一度走高,商汤和旷视一度都逼近过千亿。但这样的盛况没能维持太久,由于落地遥遥无期,到2019年,初创AI企业的融资数量就出现了下滑,AI四小龙的IPO计划也屡次失败。
当然,AI企业在资本市场的失宠,一方面与周期有关,一方面也与应用场景不足有关。
国内多家头部AI企业,都拥有丰富的专利与论文数量。截至2021年底,商汤科技累计拥有11494件全球专利资产,在各学术顶会发表论文超过700篇。但受限于落地场景贫乏,它的商业化进展并不理想。2021年市值千亿的商汤科技,年收入只有50亿元左右。
同样的问题,也要摆在ChatGPT面前。
目前来看,ChatGPT最契合的接入场景是搜索、问答和内容社区。因为机器学习需要海量数据,而这些平台本身就积累了海量的结构化数据。北美新闻聚合平台BuzzFeed已经在最近宣布,将用OpenAI辅助内容创作——AI的威力率先体现在了股价上,消息宣布后,BuzzFeed股价应声暴涨近120%。
在国内,以抖音、快手为代表的短视频平台,也拥有极强的算法能力和数据资源。不过在当下,视频内容的AIGC难度更大,在北美工作的AIGC工程师耿博士告诉“略大参考”,图片、音频、视频的AIGC更复杂,“AI绘画目前与人类创作的内容差异较大,有明显的违和感,而视频落地则更加遥远。”
机会给到了图文为主的内容平台。知乎的股价暴涨已经证实了这一点。作为问答社区,知乎积攒了丰富的可供AIGC的优质内容。2022 年第三季度财报数据显示,知乎社区内的内容量已累计超5.79亿条,问答量累计超4.82亿条。
说到底,至少现阶段的人工智能,干的还是体力活。它还无法真正像人类一样去观察、感受与提炼,人类灌入互联网的数据,是它唯一的学习样本。ChatGPT能在3个月内实现用户破亿,靠的是数据积累带来的爆发。同样,数据的丰富程度,也将成为ChatGPT概念股的分野。
02 数据为王
大火的ChatGPT,在知乎平台里也是热门话题。比如一个被广泛讨论的答主观点提到,ChatGPT最让人震惊的能力包括:推理能力,归纳能力,在语言作为媒介展现出来的对世界常识的认知,多轮对话的能力。
这些能力都离不开数据。
据悉,ChatGPT建立在对全网的内容和数据的抓取学习之上,训练量高达数十亿个文本示例。西安交大人工智能学院的浩儒博士在接受“略大参考”采访时,这样形容AI的智能化能力:“简而言之,做AI就是大力出奇迹,超强的算力加上极其庞大的数据量,以量取胜。”
曾经大名鼎鼎的阿尔法狗,靠得并不是棋道或是思想境界,而是堆量。在与专业棋手对弈前,阿尔法狗曾学习过1万多幅人类专业棋手对决的棋谱,完成了三千万盘自我对弈的棋局,由于数据量过于庞大,阿尔法狗一局棋的电费都以万元计。
数据是AI突破的关键因素,这已经是业内的共识。AIGC工程师耿博士告诉“略大参考”,类似ChatGPT这类AI的技术原理并不复杂,甚至,越简单的越有效,国内大厂都有能力做出类似的产品。而竞争的关键就在于可供AI学习的数据量。
也因此,在ChatGPT概念股们花样百出的动作中,百度的“文心一言”靠谱程度是比较高的,因为它不但具备算法技术,还积累了足够的数据样本。在ChatGPT概念股前仆后继的股价上涨之中,知乎上涨的合理程度,远远超过汉王科技这样的企业。原因依然是数据样本。
用户的搜索动作,最能直观体现数据样本的丰富程度。只有足够体量的数据样本,才能支撑起日益增长的用户搜索需求。知乎曾经在2020年四季度公布过一组搜索数据:日均搜索量达到2570万次,作为一家内容社区,这样的数据足够优秀。此后,相关数据持续上涨。2022年高考填报志愿期间,知乎相关内容搜索达到1.97亿次。
正如iPhone的核心是供应链,AIGC的核心是数据。
然而,在各大内容平台纷纷筑墙的当下,互联网数据也逐渐从开放走向封闭。就连ChatGPT都不得不求助推特,获得接通推特数据库的资格。这也意味着,哪家企业自身就拥有数据和内容,谁就拥有了AIGC的硬通货。
于是,相比坐拥专利与技术的AI企业,内容平台也可以凭借各自的内容生态,在AIGC的故事里与前者平分秋色。在中文互联网世界里,抖音、快手、知乎、百度积累了大量的数据,可以预见的是,无论是自身开发AIGC,还是与技术公司合作,它们都有望将数据发挥出更大的价值。
耿博士向“略大参考”表示,相比于AI公司,他更看好一些互联网大厂,因为他们自身就拥有庞大的数据。中银国际也给出了类似的观点:预期拥有数据和资本优势的大型平台公司,将较AI软件企业更能受惠。
在影响AIGC效果的多重因素中,数量之外,数据的质量也极为关键。
在这一点上,ChatGPT是吃过亏的,由于学习了互联网上大量鱼龙混杂的内容,ChatGPT经常会给出低质量甚至是错误的答案,甚至有网站出于内容质量的考虑,禁止用户分享 ChatGPT 生成的内容。
目前来看,知乎这样的精品化内容社区,在内容质量方面具备较大的优势。如知乎上的部分内容已经出版成册,成为多看、kindle等平台上的畅销书。
但对于多数内容平台而言,如果既想要接入AIGC,又想保障内容质量,就需要多掏钱了。浩儒博士表示,AI的学习过程中不具备辨别内容的能力,如果内容质量太低,只能花更多钱、安排更多人力去标数据。也因此他认为,AI从前是一种劳动力密集型行业,如今更像是资本密集型行业,比拼的关键就是算力和数据。
03 搭车,还是被取代?
新的工业革命。这是微软总裁纳德拉对ChatGPT的盛赞。
尽管ChatGPT是以聊天机器人的身份为大众所熟悉,但它其实是一种大语言模型,或者说,是以自然语言为界面的机器人。它不会自主创造信息,只是能够在不同架构之间进行切换,对已有信息进行归纳、总结、举例等智能化加工。
当信息流转的成本被极大降低,一部分信息壁垒被消除,变化便由此而生。
对变化保持警觉甚至是防御,是写在人类基因中的生存密码。关于人工智能,一个经久不衰的讨论是:人类的工作会被人工智能取代吗?ChatGPT的走红又一次带火了这个话题,人们开始津津乐道哪些职业会消亡,哪些互联网产品会被ChatGPT取代。
至少到现在,人工智能距离真正取代人类、取代人类创造的互联网产品,还有些遥远。
人工智能行业流行一个隐喻:聪明的汉斯。这是20世纪初因为会做数学题,而享誉德国的一匹聪明的马,后来人们发现,它之所以能给出答案,靠的是观察提问者的细微面部表情和肢体语言。后来,“聪明的汉斯”就被用来形容,那些表现出理解力,但实际上只是对训练员给出的别人难以发现的提示作出反应的个体和程序。
ChatGPT也是如此。它只是记住了1+1=2。
但这并不妨碍ChatGPT为现有的互联网产品们注入新的活力。以内容平台为例,ChatGPT可以在辅助创作、提升搜索效率、优化推送精准度等方面,发挥出技术的优势。
ChatGPT不会取代知乎们,被合理利用的话,是可以让知乎们变得更好的。
以搜索场景为例。
知乎这类内容平台,正在承载越来越多年轻人的搜索需求。但相比传统的搜索工具,它们的算法能力偏弱,往往需要人工的辅助,让优质内容更容易被搜索。比如知乎的优质创作者被称为“宝藏答主”,这种标记,一方面是因为他们的回答内容质量高,一方面其实也说明,优质内容的发现并不容易。被标记,才能被更好地看见。
也因此,ChatGPT这类AIGC大模型应用的接入,对这些内容平台带来的变化也会更加明显。因为用户对搜索效率的变化,感知往往是最直接的。
同样会让用户感知强烈的,还有推送。
内容行业最近的一次革命正是来自于此。以字节跳动为首的企业,以大数据和算法为基础,改变了整个互联网对内容的消费方式。机器取代人工,成为更加重要的推送决策者。
而AIGC显然具备再掀起一场变革的能力,或许在不久的将来,问答会取代信息流,成为用户消费内容的主流方式。尤其对于Z世代的年轻人,问答所能呈现的信息密度更高,因而也更受欢迎。
不只是内容优化,AI还能承担部分“后勤”工作,比如内容审核。
浩儒博士提到,简单的内容识别是AIGC的重要应用方向,在ChatGPT之前,已经有一定规模的应用,可以帮助审核团队对内容进行初步筛选,但代替程度还不够高,平台仍然需要维持规模庞大的团队。据抖音高管透露,抖音的内容审核团队已经达到几千人的规模。而一名内容审核每天往往需要审核上千条内容,审核消耗掉了巨大的人力资源,许多平台都曝出过审核人员的稀缺。
ChatGPT这样的语言大模型,能够进一步解放人力。除了安全性的审核,AI还有能力辨别内容的质量,决定是否给予流量扶持。
当然,ChatGPT的魔力也让人担忧:AI创作是否会侵占传统内容社区的生存空间?
耿博士对此持反对态度。他认为,AIGC 只能取代部分低级内容。更何况内容社区的核心在于人与人的连接,AI无法取代明星KOL与用户之间的情感连接。尤其对于知乎这样的平台,创作者的人格魅力,是流量创造价值的基础。现阶段,ChatGPT更适合做为辅助创作,它能够帮助创作者整理文案,减少他们的工作量。
被誉为人工智能之父的马文.明斯基曾经说过,“容易的事情做起来难”。直到现在,这句话仍然适用于人工智能的大部分领域。许多人类的工作对于计算机或机器人而言,可能比我们想象的要困难得多。
当然AIGC也在持续进化。ChatGPT并非当下最新的版本,OpenAI的GPT 4也在研发当中。多位业内人士表示,新的变革可能会引爆科技界。但也有人对它的落地应用表达了担忧,浩儒博士提到,ChatGPT 这样的技术对算力和数据的要求太高,投入大,但很难找到赚钱的场景。
ChatGPT是否会重复阿尔法狗的故事?一鸣惊人之后,把整个行业推向春天,随后猫在漫长的冬天里静静发育。答案还不确定,但知乎们已经搭上了车,它们也相信,这是一趟开往春天的列车。