10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节上,科大讯飞正式发布旗下讯飞星火认知大模型V3.0,在文本生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、多模态能力七个方面带来智能升级。同时还发布了面向工业、法律、金融等12个行业的专属行业大模型。此外,科大讯飞还联合华为正式发布基于昇腾生态的“飞星一号”国产算力平台,打造自主创新算力底座。
推动大模型赋能千行百业
本次发布会上,科大讯飞集中发布12个行业大模型。如何深入行业、解决刚需,一直是困扰大模型发展的难题。科大讯飞董事长刘庆峰认为,面向具体行业,找到刚需的应用场景是推动大模型迈向产业,进而实现商业价值的重要基础。科大讯飞此次发布的12个行业大模型,瞄准的正是许多行业中的智能化痛点。
科大讯飞研究院院长刘聪透露,科大讯飞早在启动大模型技术攻关的时候就确立了“1+N”的大模型体系。“1”代表了讯飞星火认知大模型本身,“N”是针对教育、办公、汽车、医疗、数字员工等不同领域进行“预训练”+“精调”的行业大模型,可以让产品更快落地,快速形成商业模式。
“要真正把行业做透,必须要与真正懂行业、懂应用场景的龙头企业联合打造。”刘庆峰表示,行业大模型在龙头企业内部打造成功后,可以对全行业进行赋能,所以要有开放的精神。
对于行业企业来说,可用、好用的底层技术仍然是推动大模型应用的决定性因素。“行业的头部企业愿意与你合作的前提是,你必须要有好的底层技术。”刘庆峰表示,一整套方便易用的训练工具能对行业专属内容进行高效训练,这对于大模型在行业中落地至关重要,这也是科大讯飞的核心竞争力,“我们需要开发出定制化工具,让企业内部‘拖拖拽拽’就能解决问题。”
刘庆峰认为,大模型要先解决典型场景,和行业龙头企业一起做好共性场景的应用,具备一定的行业通用能力后,需要定制的内容会越来越少,成本自然会下降。
此外,他认为,大模型想要赋能民生百业,需要实现从多轮对话、主动对话再到启发式对话的跨越,实现智慧阶跃,推动行业纵深应用。大模型不仅要能回答问题,还要像人一样主动提问。讯飞星火认知大模型V3.0便新增了个性化AI人设功能,为星火注入“灵魂”,可以根据性格模拟、情绪理解、表达风格来形成一个初始“人设”,具备长期稳定的记忆力、多样化的个性和丰富的情感,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI“人设”。
迈出必须要走的一步
就在不久前,美国政府更新出口管制规定,对向中国出售显卡采取更为严厉的管制手段,将根据显卡性能来执行出口禁令,禁止英伟达等芯片公司向中国出售具备先进性能的显卡。此外,还将两家主要从事显卡研发的中国公司列入出口管制的实体清单。
大模型训练、应用离不开由显卡搭建的算力平台。在此背景下,算力再次成为中国人工智能发展中备受关注的焦点。在此次发布会上,除了星火认知大模型3.0版本,最受关注的便是科大讯飞与华为联合发布的国产算力平台“飞星一号”。刘庆锋表示,除华为自身应用外,星火认知大模型V3.0是在国产算力平台上训练出来的大模型。
华为轮值董事长徐直军在发布会现场表示,华为的使命和愿景是把数字世界带入每个人、家庭、组织,构建万物互联的智能世界,在全面智能化战略的指引下,华为将持续打造坚实的算力底座,为世界构建“第二选择”。最终让所有对象可联接,所有应用可模型,所有决策可计算,让大模型真正赋能千行百业。
徐直军透露,讯飞星火V3.0在“飞星一号”平台上训练效率翻番,能够实现更为高效稳定的训练迭代,接下来还将为更大参数的星火认知大模型V4.0版本提供有力支撑。
自主创新的算力底座是中国大模型发展的重要基础。刘庆峰表示,虽然目前使用国产化算力平台仍然存在一定迁移成本,“比如有些任务如果使用英伟达算力平台,也许1个月能完成,全部迁移到国产算力平台的过程中,许多方面都要重新调整,可能需要付出一些时间成本,但这一步是必须迈出的。”
接下来,科大讯飞将在“飞星一号”平台的基础上,启动对标GPT-4的更大参数规模的星火大模型4.0的训练。刘庆峰说,这对于科大讯飞来说,绝不仅仅是一个简单的技术对标问题,“我们要走出自己的技术路线,走出自己的产业方向,形成自己完整的生态。”