4月13日,“2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合伙人、CTO李大海在大会上共同宣布了知乎在AI大模型上的最新合作与应用,正式发布“知海图AI”中文大模型。
知乎通过联合研发与战略投资的方式与国内顶尖大模型团队面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。
另外,李大海在会后采访中提到,“可能会把知乎的一些重要数据贡献出来,去为整个中国的开源社区建立中国自己的大模型。”
目前,知乎和面壁智能合作开发的“知海图AI”中文大模型,已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
面壁智能联合创始人、CTO曾国洋在大会演讲中表示,“经过测试,在知乎热榜的应用场景下,知乎与面壁合作自研的大模型与GPT-4相比达到了持平的效果”。
知乎CTO李大海介绍,面壁智能最新的CPM-Bee模型是视野范围内表现最好的中文大语言模型,其创始团队成员全部来自清华大学计算机自然语言处理与社会人文计算实验室(清华大学NLP实验室)。
据了解,面壁智能成立于2022年,创始人曾国洋是清华大学计算机科学与技术系副教授刘知远的学生。曾国洋在大二时加入THUNLP,目前面壁智能核心成员都曾参与智源研究院“悟道·文源”大模型研发,刘知远担任联合创始人,孙茂松、刘洋担任顾问。
据此前雷峰网报道,作为大模型赛道的新玩家,面壁智能和同样孵化自清华NLP团队的初创公司深言科技,都引起过正在“招兵买马”的王慧文注意。但面壁智能最终选择独立发展。
从创始团队来看,这两家公司的核心人物属清华孙茂松、刘知远一脉,其所依托的清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP),是国内最强的大模型学术力量之一。THUNLP是国内最早开展NLP研究、且极具影响力的科研单位,在20世纪70年代末成立之初由中国 NLP 开山人物黄昌宁带领,其学生孙茂松是ACL Fellow,刘知远则师从孙茂松。
面壁智能专注于大模型加速与应用落地,联合THUNLP与智源研究院语言大模型技术创新中心发起了 OpenBMB 开源社区,推出了 CPM-Live 百亿中文大模型直播训练项目,以及大模型全流程加速平台ModelForce。
另外,据「市界」此前独家获悉,知乎CEO周源亲自接手商业化部门,原商业化负责人高强或负责探索知乎AI向业务。有知情人士透露,知乎商业化成绩不理想或是内部调整的其一原因。
不久前,知乎发布了截至2022年12月31日的第四季度和2022年全年未经审计财务业绩报告。2022年第四季,知乎广告及内容商业化解决方案均出现了不同程度的同比下滑情况,广告业务下滑最严重,单季收入同比下滑超27%,内容商业化解决方案收入同比下滑18.9%,下滑速度仅次于广告业务。
对于大模型以及AIGC领域的布局,知乎CTO李大海在财报发布后的业绩会上表示,“最近全面评估自研AIGC技术和寻求外部合作,以及直接使用市场开放API等多种方式,来为产品和创作者赋能。知乎社区的数据优势,以及垂直专业内容的积累,会在AIGC技术革命中有独特的定位。目前在模型层和应用层都有自己的探索和尝试,希望在问答和内容消费上带来新体验。”
当下,知乎交出AI第一步答卷。
周源提到,早在十年前,知乎有一个产品功能叫“回答总结”,开放给所有用户。“大家进行wiki一样的编辑,把大家所有的回答做总结,后来发现这个事情太困难了,回答数量多了以后成本非常高,而且效果并不好。”如今,在“知海图AI”的帮助下,能够做到高效提取“回答概览”,提升用户体验。
撰文 | 赵子坤