本站点使用cookies,继续浏览表示您同意我们使用cookies。Cookies和隐私政策

华为云ModelArts 2.0全面升级,革新传统AI开发模式

华为云ModelArts 2.0,以全流程的极简和自动化,颠覆传统AI开发模式,让AI开发全链条产生质的飞越。

文/华为云人工智能领域总裁贾永利

华为云ModelArts 2.0,以全流程的极简和自动化,颠覆传统AI开发模式,让AI开发全链条产生质的飞越。本文逐一解读ModelArts 2.0的目标定位、关键技术及特性。

为AI开发带来全新体验

2019年,华为完成从芯片到软件的全栈AI能力集结,华为云AI重装升级,希望通过技术创新,为AI开发带来全新体验。

Jia Yongli

一方面,华为云追求覆盖范围之广:大幅降低初学者的门槛,让更为广泛的AI初学者群体和庞大的软件开发者群体都能快速掌握AI技能,在各行各业的应用开发中把AI用起来。

另一方面,追求技术探索之深:显著提升专业AI开发者的效率,让算法工程师、数据科学家们心无旁鹜,更加聚焦基础核心的算法研究与创新,释放他们无限潜能。  

工欲善其事必先利其器,华为云引入AI技术,推出了全面升级的一站式AI开发管理平台ModelArts 2.0,全面贯通AI开发各个环节,从数据准备、算法开发,到模型训练、模型管理、模型推理全链条,用全流程的极简和自动化来改变当前AI开发的模式。

ModelArts2.0

在第四届华为全联接大会上发布的ModelArts 2.0涵盖十余项新特性及服务,包含智能数据筛选、智能数据标注、智能数据分析、多元模型自动搜索、ModelArts SDK、图神经网络、强化学习、模型评估/诊断、模型压缩/转换、自动难例发现、持续学习等,覆盖AI模型全生命周期。  

自动化AI数据处理

数据的质量对于后续模型的训练有非常大的影响,AI开发者花费了很多时间来完成数据准备,包括数据的预处理、标注以及分析等。华为云希望首先提升效率的也是数据准备环节。 

ModelArts 2.0通过智能数据筛选,用AI的方式自动过滤和筛选出对训练模型无效的数据。以视觉类场景为例,失焦、过度曝光图片往往不能参与标注;从业务场景上看,有些不符合要求的也不能参与标注。

华为云将业界传统的主动学习进行升级,首次提出混合智能标注技术,可以让标注效率获得至少5倍以上的提升。

除了自动标注,ModelArts 2.0还提供了自动数据特征挖掘的功能,它就像一台在数据准备阶段的CT仪,帮助洞悉数据集全面特征。目前已经提供基于样本质量特征、图像全局属性、标注特征20种左右特性的自动提取和可视化能力,帮助开发者识别数据的深层关系,指导开发者对数据进行优化。  

业界领先的AI模型训练

开发者非常关心自己的开发环境和手上的工具,很多企业也有自己的开发流水线。华为云开发了ModelArts SDK,让开发者既可以享受云端充分算力的便利,又可以进行本地IDE的调试;帮助开发者与各种工具、平台做集成,形成端到端的、线上线下可以协同的开发环境。

资深算法工程师和数据科学家更加专注于数据建模和问题解决,对系统架构层面的数据分布、模型分布往往不太擅长。针对这些人群,华为AI计算框架MindSpore 提供自动化的并行能力,只需简单几行描述就可以让算法跑到几十乃至上千AI运算节点上; 提供强大的自动微分能力,从源码级别帮助实现微分算子的自动开发,以后基于MindSpore开发的任何算子都不需要手工编写反向算子的实现,仅需编写前向算子即可。这大大简化了大家开发自定义算子的工作量,极大释放专家们的创造力。

完备的AI模型管理

对于算法开发人员来说,对模型性能的评估以及调优是一项重要且难度极高的工作。要对模型进行反复调整与优化,有时候需要数周甚至数月,有人戏称这个过程叫“炼丹”。华为云提供给的智能模型诊断功能能帮助大家避免盲目炼丹。 

这个功能有丰富的模型评估接口和比较好的可视化能力,并且能够基于评估结果给AI开发者提供模型诊断建议,辅助开发者对模型进行调优和增强。模型评估和诊断给开发者提供丰富的细粒度分析报告,以物体检测为例,如果被检测目标没有检测到,ModelArts 2.0会自动提示背后的原因,并给出如何提升精度的相关建议。另外,ModelArts 2.0还可以通过细粒度的敏感度分析指导对精度影响最大的特征,并针对性地去增强数据。开发者也不需要盲目地凭借经验选择某些阈值参数,可以通过F1等曲线随阈值的变化找到最佳阈值。

持续进化AI模型推理

ModelArts2.0

现实生活中,很多开发者都在提一个很大的难题:明明在实验室开发得很好了,为何在真正的使用中就会出现各种各样的问题?特别是工业场景,很难在实验室就把所有场景估计到,无法通过收集大量数据去调整和优化出一个非常完美的模型。这个问题怎么解决呢?

ModelArts 2.0业界首发难例自动发现功能,推理引擎实时监控推理的效果,发现没有做好的难例,自动将它收集,通过持续在线学习等多种手段进行优化,真正做到企业级的可进化的AI。

这个功能已经在华为云自动驾驶云服务Octopus上试运行,实测结果证明,可以显著提升复杂场景的难例发现效率,大幅提升最终模型质量。

现实生活中,还有非常多的数据不能以欧式空间、应用时空关系建模,也就不能以RNN、DNN这些常见的神经网络模型进行学习,比如基因组之间并没有明确的谁在谁后面、前面,这些场景下如何建模?

ModelArts 2.0独创的多元搜索技术,将自动数据增强、超参自动搜索、神经网络架构搜索等技术进行融合,可以帮助用户快速构建AI模型,并且在精度表现上远超业界水平。以构建细胞发育时期分类模型为例,华为云EI团队通过多元搜索技术构建的单细胞基因图谱表达分类模型精度,相对于通过传统自动学习方法构建的模型,精度提升5.4个百分点,同时模型训练速度快了5倍。 

有了这个多元搜索的强大功能,可以让制药、金融、生物工程、工业等各个跨学科领域能够找到自己的利器,让这些跨领域的专家能够充分释放他们无限的潜能。

ModelArts2.0

华为全栈全场景AI解决方案不是封闭的,而是水平分层解耦并且能力开放的,每一层都兼容业界现有的优秀技术。希望不同类型的开发者,不同使用场景下都可以找到自己最适合的工具与服务,能够开发出适合这个场景的应用。    

作为开发者获取AI开发最便捷的入口,华为云已经完整集成了华为全栈全场景AI方案。华为云会秉承普惠AI理念,一起共同构建繁荣的AI生态,让大家用得起、用得好、用得放心,也用得开心。