讯飞华为发布国产算力平台推动大模型进入千行百业-武陵观察网

10月24日，在第六届世界声博会暨2023科大讯飞全球1024开发者节上，科大讯飞正式发布旗下讯飞星火认知大模型V3.0，在文本生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、多模态能力七个方面带来智能升级。同时还发布了面向工业、法律、金融等12个行业的专属行业大模型。此外，科大讯飞还联合华为正式发布基于昇腾生态的“飞星一号”国产算力平台，打造自主创新算力底座。

推动大模型赋能千行百业

本次发布会上，科大讯飞集中发布12个行业大模型。如何深入行业、解决刚需，一直是困扰大模型发展的难题。科大讯飞董事长刘庆峰认为，面向具体行业，找到刚需的应用场景是推动大模型迈向产业，进而实现商业价值的重要基础。科大讯飞此次发布的12个行业大模型，瞄准的正是许多行业中的智能化痛点。

科大讯飞研究院院长刘聪透露，科大讯飞早在启动大模型技术攻关的时候就确立了“1+N”的大模型体系。“1”代表了讯飞星火认知大模型本身，“N”是针对教育、办公、汽车、医疗、数字员工等不同领域进行“预训练”+“精调”的行业大模型，可以让产品更快落地，快速形成商业模式。

“要真正把行业做透，必须要与真正懂行业、懂应用场景的龙头企业联合打造。”刘庆峰表示，行业大模型在龙头企业内部打造成功后，可以对全行业进行赋能，所以要有开放的精神。

对于行业企业来说，可用、好用的底层技术仍然是推动大模型应用的决定性因素。“行业的头部企业愿意与你合作的前提是，你必须要有好的底层技术。”刘庆峰表示，一整套方便易用的训练工具能对行业专属内容进行高效训练，这对于大模型在行业中落地至关重要，这也是科大讯飞的核心竞争力，“我们需要开发出定制化工具，让企业内部‘拖拖拽拽’就能解决问题。”

刘庆峰认为，大模型要先解决典型场景，和行业龙头企业一起做好共性场景的应用，具备一定的行业通用能力后，需要定制的内容会越来越少，成本自然会下降。

此外，他认为，大模型想要赋能民生百业，需要实现从多轮对话、主动对话再到启发式对话的跨越，实现智慧阶跃，推动行业纵深应用。大模型不仅要能回答问题，还要像人一样主动提问。讯飞星火认知大模型V3.0便新增了个性化AI人设功能，为星火注入“灵魂”，可以根据性格模拟、情绪理解、表达风格来形成一个初始“人设”，具备长期稳定的记忆力、多样化的个性和丰富的情感，再结合特定知识学习、对话记忆学习，形成一个更个性化的AI“人设”。

迈出必须要走的一步

就在不久前，美国政府更新出口管制规定，对向中国出售显卡采取更为严厉的管制手段，将根据显卡性能来执行出口禁令，禁止英伟达等芯片公司向中国出售具备先进性能的显卡。此外，还将两家主要从事显卡研发的中国公司列入出口管制的实体清单。

大模型训练、应用离不开由显卡搭建的算力平台。在此背景下，算力再次成为中国人工智能发展中备受关注的焦点。在此次发布会上，除了星火认知大模型3.0版本，最受关注的便是科大讯飞与华为联合发布的国产算力平台“飞星一号”。刘庆锋表示，除华为自身应用外，星火认知大模型V3.0是在国产算力平台上训练出来的大模型。

华为轮值董事长徐直军在发布会现场表示，华为的使命和愿景是把数字世界带入每个人、家庭、组织，构建万物互联的智能世界，在全面智能化战略的指引下，华为将持续打造坚实的算力底座，为世界构建“第二选择”。最终让所有对象可联接，所有应用可模型，所有决策可计算，让大模型真正赋能千行百业。

徐直军透露，讯飞星火V3.0在“飞星一号”平台上训练效率翻番，能够实现更为高效稳定的训练迭代，接下来还将为更大参数的星火认知大模型V4.0版本提供有力支撑。

自主创新的算力底座是中国大模型发展的重要基础。刘庆峰表示，虽然目前使用国产化算力平台仍然存在一定迁移成本，“比如有些任务如果使用英伟达算力平台，也许1个月能完成，全部迁移到国产算力平台的过程中，许多方面都要重新调整，可能需要付出一些时间成本，但这一步是必须迈出的。”

接下来，科大讯飞将在“飞星一号”平台的基础上，启动对标GPT-4的更大参数规模的星火大模型4.0的训练。刘庆峰说，这对于科大讯飞来说，绝不仅仅是一个简单的技术对标问题，“我们要走出自己的技术路线，走出自己的产业方向，形成自己完整的生态。”

讯飞华为发布国产算力平台,推动大模型进入千行百业

相关文章