科技日报实习记者 罗云鹏
在多人线上数小时的会议后,大模型快速准确地提炼各方观点输出会议纪要、一键生成标准格式文本、自动基于表格内容展现图表、辅助医疗影像诊断、预测疾病、在自动驾驶中的感知与决策、在工业制造中控制质量、诊断故障……时下大模型技术正转换为实实在在的生产力。
过去一周,国内大模型热度持续攀升。9月7日,随着腾讯混元大模型正式对外亮相,至此国内市场已有超过130个大模型,而一个个大模型的背后,自主创新是绕不开的话题。
上半场聚焦研发“马拉松”
Token,大语言模型最小文本单位。腾讯混元大模型正式对外亮相时,这个小小的文本单位已从0跃升至超2万亿。
“腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法、机器学习框架、人工智能基础设施的全链路自研技术。”腾讯集团副总裁蒋杰说,“从2021年开始,不断在加大技术的投入,这是不断积累的过程。”
大模型的研发无疑是一场“马拉松”。复旦大学中国研究院副研究员刘典认为,人工智能的发展不是一蹴而就,需要继续加强对人工智能的投入,坚持自主研发、自立自强,做好在人工智能领域“打持久战”的准备。
一项来自腾讯内部的数据显示,从2021年开始,先后推出了多个千亿和万亿参数的大模型,在实际应用中不断优化大模型底层算法开发,提升工程能力。2018年起,累计投入研发经费超过2300亿元。在全球获得专利授权3.3万件,申请总数超过6.6万件。
事实上,同为科技企业的百度,也经历了马拉松式的研发投入。公开数据显示,近十年,百度累计研发投入超过1400亿元,大模型所涉及的深度学习、自然语言处理、人类反馈的强化学习等技术。
百度创始人、董事长兼首席执行官李彦宏在参加2023世界互联网大会时表示,更创新、更领先的大模型,可以为解决全球医疗卫生、气候变化、经济增长等重大挑战,提出“中国方案”。
从2019年开始,中国科学院自动化研究所就多模态大模型领域开始攻关,通过对海量数据弱关联图文音数据的跨模态自监督学习,于2021年9月正式发布了千亿参数多模态大模型“紫东太初”。
“从算法到硬件、算力,‘紫东太初’都是‘中国造’。”中国科学院自动化研究所紫东太初大模型研究中心常务副主任王金桥此前在接受媒体采访时说,“在国产软硬件的支撑下,我们的大模型一样能跑得很好、很快。”
2023年6月,科技部新一代人工智能发展研究中心发布《中国人工智能大模型地图研究报告》。报告显示,从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%。
中国信息协会常务理事、国研新经济研究院创始院长朱克力认为,当前国家对民营经济高度重视,作为我国数字科技公司多年来重视科技创新的阶段成果,(大模型)构成了我国加快实现高水平科技自立自强的有机力量。
下半场锚定服务千行百业
记者梳理发现,时下,在大模型应用领域,阿里达摩院的“通义”、商汤科技的“商量”、中国科学院的“紫东太初”、抖音的 “云雀”等已在不同行业和领域落地应用。
“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新思路。” 腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,大模型需要基于产业场景,与企业数据融合才能释放出最大价值。
在9月5日举行的2023百度云智大会上,李彦宏曾公开表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,“卷大模型没有意义,卷应用机会更大”。
上海财经大学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,并且已经在数字技术和应用上取得了巨大成就,为中国的大模型提供了更深入、更丰富的落地场景以及能够“持续训练,终身学习”的环境。
据腾讯数据,目前腾讯已和1.1万家生态伙伴展开紧密合作,推出覆盖100多个产业场景的行业解决方案,共同服务千行百业。而据百度数据,已有500多家生态伙伴通过百度智能云千帆大模型平台使用各类大模型服务,千帆大模型平台上月活企业数超过1万家。
“大模型的价值在于应用。”清华大学人工智能研究院视觉智能研究中心主任、教授邓志东认为,只有在多样化的实际应用场景中赋能智能经济与智能社会的发展,才能找到产业价值,同时也才能成就大模型自身。
值得一提的是,2023年6月,腾讯云推出了模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务,可根据客户需求高效率、低成本定制大模型及智能应用。
“未来大模型产品发展趋势可能是通用大模型与垂直领域细分模型的结合。”中国人民大学数字经济研究中心主任李三希认为,不仅需要具备坚实的技术基础,如具备大规模、高质量、多样化的语料库、创新的大模型算法、自研的机器学习框架和强大的算力基础设施等,也需要大模型产品需要具有坚实的基于场景的应用,从实践中来,到实践中去的“实用级”大模型将成为趋势。