日前,IDC发布了《2022年亚太地区(不含日本)AI生命周期软件工具和平台供应商评估》报告,在其评估的供应商中,亚马逊云科技凭借机器学习旗舰产品Amazon SageMaker的功能、交付能力以及在开源方面的优势,被IDC列入“领导者”阵营,并居于图中最高最远位置。
来源:IDC MarketScape:2022年亚太地区(不含日本)AI生命周期软件工具和平台供应商评估。IDC,2022
IDC MarketScape评估模型通过综合考量厂商在产品、服务、能力和策略等方面的表现能力及竞争力,对特定市场进行定量和定性评估。研究报告以清晰易读的图形进行总结,为行业用户及IT厂商制定技术决策提供必要信息。如上图所示,报告中,亚马逊云科技在能力和战略两个维度都获得最高分,在以圆圈为代表的市场份额方面,亚马逊云科技也位居前列。
亚马逊云科技参与评估的解决方案Amazon SageMaker可为客户的数据准备、模型构建、训练、评估、部署、MLOps和可信度提供端到端的完全托管服务,为企业的整个机器学习生命周期提供支持。IDC报告指出,凭借在功能和产品、服务交付和增长方面的优势,Amazon SageMaker成为亚马逊云科技增长最快的云服务之一。
以AI绘画走红全球的新晋独角兽公司Stability AI,去年推出了开源AI模型Stable Diffusion。借助这一模型,任何人只需要提供一段文字描述,就有机会创作出任意风格的绘画作品。Stable Diffusion自2022年8月推出以来,已经被全球超过20万开发者下载和授权。Stability AI的消费级产品DreamStudio注册用户来自全球50多个国家,已经超过100万,他们共同创建了超过1.7亿张图像。
Stable Diffusion这样的模型训练起来非常困难,需要使用数千个GPU或Amazon Trainium机器学习训练专用芯片。Stability AI 选择亚马逊云科技作为首选云提供商。通过使用 SageMaker 托管的基础设施和优化库,Stability AI能够使其模型训练具有更高韧性和性能。例如对于 GPT NeoX 等模型,Stability AI 使用 SageMaker 及其模型并行库将训练时间和成本减少 58%,同时,这些优化和性能改进适用于具有数百或数千亿参数的模型。
Amazon SageMaker旨在打破机器学习的壁垒,推进前沿技术的普惠化,把机器学习能力真正从研究实验室交到企业手中,亚马逊云科技在2017年 re:Invent 全球大会上首次推出。Amazon SageMaker由十几种工具组成,包括SageMaker Data Wrangler、SageMaker Studio、SageMaker Autopilot、SageMaker Canvas和SageMaker Clarify等,并不断根据客户需求推出新的功能和特性。
亚马逊云科技近年来一直在Amazon SageMaker套件中快速推出新功能和特性。在过去的六年时间里,亚马逊云科技为其增加了超过290项新的功能和特性,包括调试器 (SageMaker Debugger)、模型监视器 (SageMaker Model Monitor)、剖析器(SageMaker Clarify)、AutoML (SageMaker Autopilot)、特征商店(SageMaker Feature Store)、无代码功能 (SageMaker Canvas),以及第一个专门用于机器学习持续集成和持续交付(CI/CD)的工具,使机器学习在云端和边缘设备上变得更为简便,可扩展性更强。
这些功能和特性往往秉承开源特色,体现出强大的工程灵活性,支持快速交付和部署,可以有效支持用户的规模化推理,具有良好的性价比,可以为用户带来数据引力和规模经济等好处。
据此,IDC推荐具有构建者/开发者文化的企业、致力于以相对较小规模团队或较低运营成本来扩展ML/DL模型的企业,以及重视技术支持质量和及时性的企业使用Amazon SageMaker。
过去,从事机器学习需要专门技能,通常由数量有限的开发人员、研究人员或以机器学习为主要业务的公司所有。开发人员和数据科学家必须首先将数据可视化、转换和预处理为算法可用训练模型的格式,涉及大量的算力、漫长的训练周期,并需要设立专门的团队来管理环境。这些环境通常跨越多个支持GPU的服务器,以及需要大量的人工性能调整。
此外,在应用程序中部署经过训练的模型需要一套不同的应用程序设计和处理分布式系统的专业技能。随着数据集和变量的增加,新信息的出现,旧模型变得不再可用,企业不得不重复上述过程。这导致除了资金充足的企业和研究机构外,大多数人都无法接触到机器学习。
为此,Amazon SageMaker推出了全球首个用于机器学习的集成开发环境(IDE),使开发人员、数据科学家和商业分析师能够快速、轻松地准备数据,并在规模上构建、训练和部署高质量的机器学习模型,例如Amazon SageMaker Canvas为没有机器学习经验的商业分析师提供的无代码环境。Amazon SageMaker Studio Lab为学生提供无需设置、不收费的机器学习环境,让他们能够更快地学习机器学习技能。
最近,亚马逊云科技在2022 re:Invent全球大会上宣布Amazon SageMaker 推出八项新功能,包括:新的 Amazon SageMaker 机器学习治理功能可以在整个机器学习生命周期中提供对模型性能的可见性;新的 Amazon SageMaker Studio Notebooks 功能提供了增强的Notebooks体验,让客户只需点击几下即可检查和解决数据质量问题,促进数据科学团队之间的实时协作,通过将Notebooks代码转变到自动化作业加速机器学习实验到生产的过程;Amazon SageMaker Geospatial ML 让地理空间数据处理变得更容易等等。
此次发布的新功能让团队能够更轻松地协同机器学习模型的端到端开发和部署,将数据扩展到地理空间,帮助客户大规模利用机器学习,并更好地进行机器学习相关的模型治理。
LG人工智能研究院最近推出了由超大“人工智能语言模型”EXAONE驱动的人工智能艺术家Tilda。Tilda可以处理2.5亿个高清图像-文本对数据集,并且通过多模态人工智能创造全新的图像。Amazon SageMaker的扩展和分布式训练能力,在开发EXAONE时发挥了至关重要的作用。训练Tilda这样的超大模型需要海量计算,高效的并行处理至关重要,此外,对大规模数据实现可持续管理,灵活处理新获取的数据也是必要条件。LG人工智能研究院通过使用Amazon SageMaker训练模型和分布式训练库,在未对训练代码进行重大修改的情况下,训练模型的速度提高了59%。
香港职业教育学院的IT部门使用Amazon SageMaker Studio Lab为学生提供参与真实世界机器学习项目的机会,而不会被设置或配置所困住,从而能做更多的编码练习。在基础机器学习和Python相关的课程中使用Amazon SageMaker Studio Lab可以为学生在多项云技术方面打下坚实基础。