图片来源@视觉中国
文 | vb动脉网
“崭新的计算平台已经诞生,AI的‘iPhone时刻’已经到来,加速计算和AI技术已经走进现实,”在3月21日GTC 2023春季大会的开场演讲中,春风得意的英伟达创始人兼首席执行官黄仁勋这样总结近来AI技术的突破——在本次GTC上,与生成式AI相关的主题会议超过了70场。
这一看法并不夸张。一天前,微软和Nuance发布一款让医生临床记录“iPhone化”的杀手级AI应用,也是医疗行业第一款结合GPT4模型的应用,距离GPT-4发布不到一周时间。微软在此前投给OpenAI创纪录的100亿美元看起来非常超值,不仅创造了微软在医疗领域的高光时刻,也代表了科技巨头在医疗领域持续加码的大潮。
在GPT-4发布的前一日,谷歌刚刚拿出了专门针对医疗的生成式AI模型。虽然比爆火的ChatGPT来得晚了一些,但生成式AI在医疗上有着充分的发挥空间,这场马拉松比拼的不是谁先起跑,而是谁能坚持到最后。
已经入局的科技巨头正在持续深耕,还未进入的则在抓住每一个潜在的机会入局。对此,半导体巨头AMD也直呼“Yes”。毕竟它几十年来首次将自己的箭头标志刻印到了医疗领域。
科技巨头在医疗的加码内卷,会带给我们什么?值得期待。
微软巨资收购Nuance,GPT-4加持医疗后发制人
微软进入医疗的时间其实很早,早在1999年就投资了医疗信息网站WebMD。此后数年,微软也陆续收购了一些医疗相关企业。但彼时微软并未将医疗当作主要业务,也未对这些业务进行整合。
2017年,微软启动了Healthcare NExT,开始系统性进军医疗。这一次微软将方向指向当时方兴未艾的医疗AI,希望利用微软在AI和云计算方面的优势推动医疗创新,主要目的包括减轻医生的数据录入负担、分流病人及监督病人院外护理。
在此后几年,微软在医疗领域基本延续了这一方向。并在2020年推出了微软第一个专门针对医疗行业的云计算解决方案——Microsoft Cloud for Healthcare。
不过,坦白而言,拥有这些业务的微软在医疗领域的名气并没有后来被收购的Nuance大。Nuance曾是语音AI领域的领导者,不仅是苹果Siri语音引擎的开发者,更曾经在全球智能语音市场中占据六成以上的市场份额。在受到科技巨头的挑战后,Nuance将业务重心转向医疗领域,并通过数年深耕建立了很高的竞争壁垒。
2021年4月,微软宣布以197亿美元巨资收购Nuance。这笔交易是微软成立迄今第三大收购案,极大地加强了微软在医疗垂直领域的影响力。
Nuance的服务已经被嵌入微软医疗云,可以为医生提供语音识别和转录服务。语音AI能够智能识别医生与患者的对话内容,并进行语境分析,随后将数据输入到电子病历中自动创建临床记录,以提升医生诊断的有效率。
GPT模型的加入将大幅度提升临床记录的生成时间。一般而言,未引入GPT-4模型的DAX生成临床记录需要约四个小时左右。依靠GPT-4强大的生成式大语言模型和推理能力,DAX Express将这个过程缩短到仅仅几秒钟。
这极大地改善医生的使用体验,减少其处理文书工作的负担,使得无延时的临床记录成为可能,并提升了效率。
对于微软来说,率先引入GPT-4将使其在医疗领域的影响力有极大提升——现在知道微软也在深耕医疗的人比以往显然要多出几个数量级。
这种抢先并不难理解。微软过往几年持续投资OpenAI,并在1月底追加了据说100亿美元的投资;还为其提供Azure云服务;甚至还专门为OpenAI打造了一台超级计算机,用来在Azure公有云上训练GPT-3。能够满足这种训练所需海量算力的商业实体,在全球也屈指可数。
相比ChatGPT背后所使用的GPT-3.5,GPT-4的解答能力及正确率都有大幅提升。GPT-4.0在美国SAT考试获得了163分(满分180分)的高分,超越了88%考生的成绩。同时,它在律师资格考试中也超过了90%的考生,相比之下,GPT-3.5只有倒数10%的水平。
不过,大众在使用ChatGPT的过程中也发现,生成式AI仍然存在一些问题,尤其是“一本正经的胡说八道”可能会制造相当多的认知偏差和虚假信息。毕竟这项技术的本质是通过概率最大化不断生成数据,而不是完全通过逻辑推理对问题进行解答的算法模型。此外,由于生成式AI具有一定的自主性,数据安全和隐私泄露也被认为是一大隐患。
无论如何,在这场科技大佬加码医疗的竞争中,微软的提速已使它领先了半个身位。
多年探索医疗叫好不叫座,谷歌的调整需要时间
就在微软携GPT杀入医疗领域的前一天,刚刚召开了“The Check Up with Google Health”年度活动,以展示其在医疗领域的最新发展。医疗AI则是其中的重点。
在ChatGPT走红之前,一直被认为是AI领域的顶流。DeepMind和AlphaFold在彼时的热度丝毫不比OpenAI和ChatGPT现有的热度差。在去年ChatGPT发布后短短几周,便和DeepMind拿出了Med-PaLM。
这是一个专门针对医疗健康领域的大型语言模型——在过去几年,一直在进行医学大型语言模型的研究,以应对医疗领域所需的专业性和特殊性。
Med-PaLM模型取得了不俗的成绩。它是第一个在美国医疗许可类问题上获得“及格分数”(>60%)的AI,不仅准确地回答了多项选择题和开放式问题,还提供回答理由并对自己的回答进行评估。
在本次活动上,展示了Med-PaLM 2。据介绍,新版本模型的表现比之前提高了18%,远超过其他同类的人工智能模型(当然,彼时GPT-4还未发布)。在医学考试中,Med-PaLM 2的表现已经基本接近“专家”医生的水平,得分达到了85%。
不过,也坦承这些进步虽然可喜,但距离在真实环境中部署仍有不小的距离。来自不同背景和国家的临床医生和非临床医生根据14项标准(包括科学真实性、精确性、医学共识、推理、偏见和伤害等)对模型进行了评估。团队发现Med-PaLM 2在回答医疗问题和满足对产品卓越标准方面还有一些距离。未来,也将会持续与研究人员和全球医学界合作,希望能够让这项技术真正帮助改善医疗服务。
虽然Med-PaLM 2暂时不能投入实用,但在影像AI上倒是取得了不少进展。在去年10月,Google Health与iCAD达成协议,将谷歌的乳腺影像AI技术整合到其乳腺影像产品中。这也是谷歌首次将其乳腺成像AI模型部署到临床实践。
在本次活动上,也宣布将进一步加强超声AI模型的构建,用于孕产妇护理及乳腺癌早筛等,从而帮助解决全球超声影像医生普遍缺乏及超声检查质量参差不齐的痛点。
同时,也在和妙佑医疗国际合作,利用AI辅助放疗规划。此外,还将在非洲推动AI辅助早筛结核病——根据统计,全球超过25%的结核病死亡发生在非洲。
在医疗上的进展虽然看起来热闹,但与同期微软的亮眼表现相比,就有点“没有对比就没有伤害”的意味了。
事实上,近年来在医疗领域的探索并不如意。2021年,这家科技巨头的业务业务迎来巨震——宣布改变其医疗保健战略,解散了曾经独立的Google Health,其人员也被融入到现有的其他业务线。
商业化一直以来是在医疗健康领域面临的难题。在的年报中,Other Bets业务指不同发展阶段的新兴业务,包涵了医疗及互联网服务等业务。这一业务单元的收入长期没有什么长进,一直维持在6-7亿美元左右;其亏损倒是逐年增加,2021年已经达到了53亿美元之多。
组织架构导致业务重叠或许也是近来在医疗领域表现一般的原因。从2015年改组为Alphabet开始,各条医疗健康产品线逐渐聚合和独立的业务单元。到了2021年初,的医疗健康业务大致可以分为Google Health、Verily和Calico三个单元。这些单元的业务之间长期存在交叉重叠,使得原本就不顺畅的商业化更加雪上加霜。
在如今的新架构下,能不能在医疗领域上找到感觉还需要进一步验证。但它的例子也说明医疗领域的特殊性——即使是战无不胜的科技巨头,也很难玩得转。
致力打造医疗AI基座的英伟达,正迎来人生巅峰
如今火遍全网的GPT是大型语言构建模型的一种,所谓“大型”,从近几年GPT模型的规模变化上可见一斑。2018年发布的初代GPT参数量只有1.17亿,预训练数据量仅有5GB。GPT-3的参数量则已经暴增到1750亿,预训练数据量更是达到了45TB(1TB=1024GB)。
已经亮相的GPT-4并未公布相应的指标,但以OpenAI的风格,以及大幅优于上一代的表现来看,模型规模大概率会高出不少。这需要巨大的算力才能完成模型训练和推理,且成本极为高昂。
根据媒体报道,微软为OpenAI模型训练打造的超级计算机拥有28.5万个CPU核心及超过1万颗在当时尚属顶级的V100 GPU——即使将V100更换为目前主流的A100,仍然需要3000颗的规模。
此外,GPT3一次训练的花费超过460万美元,相应的云资源成本一年下来也要近亿美元。整个2022年,OpenAI在GPT-3的训练上花费超过5亿美元。全世界也没有几家企业有这样的财力应付这样一个暂时无法产生任何收入的“吞金兽”。这也是之前这类大型语言模型未能流行的重要原因。
随着生成式AI逐渐获得认可,对于算力的需求正在急剧膨胀。据OpenAI测算,自2012年以来,全球头部AI模型训练算力需求几乎每3-4个月就翻一番,每年头部训练模型所需算力的增长幅度高达10倍。
对于AI基础算力提供者的英伟达而言,没有比这更好的消息了。在ChatGPT引发的生成式AI热潮下,英伟达的股价自年初以来已经上涨近八成,达到了271.91美元(3月23日),市值逼近6500亿美元,一举超过特斯拉。
英伟达创始人兼首席执行官黄仁勋表示,AI的“iPhone”时刻已经到来(截图自视频直播)
在近日召开的2023年春季GTC大会中,与生成式AI相关的主题会议超过了70场。同时,英伟达火速拿出了专门针对生成式AI的H100 NVL GPU。虽然未能来得及打造全新的架构,但通过将两颗目前顶级的H100GPU拼接,仍然可以将算力提升2-3倍。
英伟达和日本头部商业财团三井物产合作研发Tokyo-1超级计算机,以利用生成式AI为日本制药行业和初创企业的药物研发赋能。包括安斯泰来制药、第一三共制药和小野制药等日本药企顶流都已计划应用这一超级计算机。
同时,英伟达还推出了NVIDIA AI Foudations云服务,以帮助需要构建、完善和运行自定义大型语言模型及生成式AI的客户加速生成式AI的引入。这一服务包括用于自然语言处理的Nemo、图像处理的Picasso,以及针对制药业的BioNeMo。
其中,BioNeMo可以加速加速药物研发过程中最耗时、费用最高的阶段。它可提供预训练模型,并使用专有数据自定义服务于药物研发流程各阶段的模型——其中就包括生成式AI,如帮助研究人员设计特有蛋白质的ProtGPT-2。
通过这些模型,BioNeMo可以帮助研究人员识别正确的靶向目标、设计分子和蛋白质并预测它们在人体内的相互作用,从而研发出最佳候选药物。
生成式AI模型能够快速识别潜在的药物分子,在某些情况下甚至可从零开始设计出化合物或基于蛋白质的治疗药物。这些模型在小分子、蛋白质、DNA和RNA序列的大型数据集上进行训练后,可以预测蛋白质的3D结构和分子与目标蛋白质对接的程度。
目前,已有不少药企尝试使用生成式AI设计新的候选药物。安进(Amgen)就使用了BioNeMo来加快其生物制剂的研发流程,来探索和研发出新一代药物中的治疗性蛋白质。
除了药物发现外,生成式AI在药物设计、剂量选择等药物开发环节中也可提高效率并完善治疗效果。预计到2040年,生成式AI可能会为医疗行业带来1万亿美元的价值。
通过多年的持续加码,英伟达在医疗领域已经成功构建了一个庞大的AI底座,并与医疗生态互为赋能。一方面,通过硬件升级持续提供基础算力,并加入软件及服务帮助客户快速导入应用,英伟达正持续挖掘医疗AI这一肉眼可见的巨大“金矿”。另一方面,医疗AI也通过英伟达软硬件的加持获得了巨大的提升,从而在更多的场景发挥更大的作用。
500亿豪赌让AMD在医疗也可以Yes!
2022年,在进军医疗领域的科技巨头上又多了一个响当当的名字,这便是AMD。作为英特尔和英伟达的老对手,AMD同样也是基础AI算力的提供者。不过,一直以来,它都没有在具体业务中尝试医疗领域。
2020年10月,AMD宣布以350亿美元收购FPGA巨头赛灵思(Xilinx)。由于赛灵思是FPGA第一大厂(2020年其市占率高达49%),这起收购引发了各国旷日持久的反垄断审查,直至2022年才正式完成。随着在此期间赛灵思的股价上涨,并购规模也达到了近500亿美元,创造了半导体产业并购重组的新纪录。
深耕FPGA的赛灵思数十年来在医疗、航空航天、汽车、国防等行业积累了诸多客户资源,对新AMD价值连城,也为其赢得了包括医疗在内诸多高壁垒细分市场的“入场门票”。
FPGA在医疗成像领域早已得到广泛应用。全球主要医疗器械厂商都在大量使用FPGA。其应用范围主要有超声成像、3D渲染、X射线的数据采集、核磁共振成像接口等。此外,在内窥镜或者是除颤器、病人监护仪中也可以看到FPGA的踪影。在这些应用中,FPGA可以提供比DSP更强的运算能力,让成像过程中的一些算法得到高速执行。
作为FPGA领域的领导者,赛灵思在这些应用上早已有多年深耕。借由收购赛灵思,AMD也得以首次把自己的“箭头”标志刻印到医疗领域。
2023年初的CES展会上,AMD发布其首个用于Vitis 2022.2统一软件环境的医学成像库(Medical Imaging Library),以提供更好的超声成像质量——目前,继续提升超声成像质量和成像精准性正面临越来越大的挑战。
AMD的医学成像库可极大地提升成像质量并降低延时。通过为赛灵思的FPGA芯片硬件部署超高性能的超声波束成形算法,超声设备即使在难以扫描的腹部或心脏部位,也将可以获得以低延时高质量的成像效果。
此外,这一医学库还采用了三级库设计,从第1级的模块构建到第3级的完整超声波束成形器设计一应俱全,这将为设备厂商提供丰富的选项,从而帮助他们缩短开发时间,将产品更快推向市场。
坦白而言,AMD目前在医疗领域的应用场景还较为单一,但未来可期。这是因为配合专用算法的FPGA因其较为灵活的可配置特性和特定环境不逊于GPU的性能可以成为AI公司的另外一个选择。
比如,在辅助病情诊断(慢性病筛查和风险评估)等场景,通过学习过往慢性病患者数据可以预测未来患病风险。这类场景使用FPGA也可实现模型训练、推理性能的提升。
再加上既有的CPU和GPU产品线,AMD在医疗领域还有很大的潜力可以挖掘。
科技巨头为何纷纷进军医疗,难点何在?
科技巨头纷纷加码医疗领域并不奇怪。首先,医疗市场的规模实在可观。根据统计,美国医疗市场规模在2021年达到4.09万亿美元。这个数字包括医疗保健设施和服务、制药、医疗器械和产品、以及医疗保险等多个领域的支出,还没有包括与医疗相关的研究和发展支出。
同时,医疗领域的支出往往都是刚需支出。这并不难理解——毕竟,砸锅卖铁治病并不少见,但砸锅卖铁仅仅只是为了一时的享受实在罕见。正因为此,当经济下行时,消费科技领域受到的冲击远远大于医疗领域。很不幸的是,这就是目前发生的情况——根据世界银行的研究报告,目前全球经济正处于1970年以来最严重的下滑。
尽管如此,科技巨头多年来在医疗领域的表现能够对得起其投入的实在是凤毛麟角。动脉网认为,科技巨头在医疗健康领域表现不佳,通常来说有几个原因。
基于其属性,科技巨头进军医疗健康领域往往选择自身技术优势的延伸,以技术创新的方式入手。这种创新一旦成功必然建立起牢固的优势,比如英伟达基于GPU在AI加速上取得的巨大成功。遗憾的是,技术创新的失败率非常之高,往往需要多次的尝试。
科技巨头在进入医疗后会发现行业环境发生了巨大的改变,患者隐私保护、数据收集标准在以往或许并不是个大问题,但在强监管的医疗健康领域往往成为巨大障碍。以往通过数据驱动的方式很难解决医疗保健中最复杂的事情。
由于之前的成果,科技巨头往往会迷信以往的成果,天真地以为技术可以解决医疗领域的所有问题。遗憾的是,对于患者而言,问题更多的是整体体验,而不是技术本身。事实上,人们在医疗问题上往往偏于保守,宁愿选择经过验证、成熟稳妥的方案,新技术的应用推广往往需要相当长时间的蛰伏期。
与专注于医疗健康的科技公司不同,难以盈利的医疗健康业务在科技巨头中只能获得少数公司资源,也没有连贯的企业级战略,很难将分散于各部门的零散医疗业务聚集起来形成合力。对于医疗的长期投入也缺乏心理准备,业务部门的策略不得不经常变动,难以持续。这在需要长期稳定投入和高度耐心的医疗领域是行不通的。
如何将自身的优势与医疗的特点相结合,从而在医疗领域实现破局,真正在医疗领域“叫好又叫座”。对于已经或者想要进军医疗领域的科技巨头来说,都将是一个值得深思的问题。
我们期待科技巨头们能够更好地介入医疗领域,从而为推动医疗行业的数字化转型和智能化升级做出更多贡献。