工业AI项目试错成本高、数据质量低?五大趋势推进AI驱动系统实现

电子说

1.3w人已加入

描述

AI不仅推动了智能助手、机器翻译和自动驾驶等应用的发展,还为工程师和科学家提供了一套处理通用任务的新技术。不过,虽然许多企业都认识到了AI的价值和潜力,但落地依然很难。
 
许多企业一度被实施AI的难度吓倒——他们认为要做AI就必须成为数据科学专家;顾虑开发AI系统既费时又费钱;缺乏高质量的标记数据;将AI集成入现有算法和系统中成本高而且很复杂……
 
这些挑战正在从多个维度被逐步攻克。MathWorks首席战略师Jim Tung在接受《电子发烧友》采访时预测,随着人工智能在多种工业应用中的快速发展,2020年将成为“AI驱动系统”年。其中,“系统”是关键词,有五大应用趋势将促成这一预测的实现。
MathWorks首席战略师Jim Tung

五大趋势促使2020年成为“AI驱动系统”年

趋势一:现有劳动力技能、数据范围和质量之间的壁垒,开始消弭
 
Gartner在2019年的一项调研中,询问了多家工业企业如下问题:“目前正在进行的AI项目有多少?在未来一年、两年和三年中预期将进行多少项目?”调研结果显示,未来3年中,企业开展的AI项目数量将增长10倍,并将其作为优先任务。
 
针对同一批调查对象,Gartner就这些企业在应用人工智能和机器学习技术时所面临的挑战进行调研,发现首要的两个壁垒是:团队技能,以及数据的可用性(主要指合适范围和质量的数据)。这两大壁垒对于AI技术的成功应用十分重要,亟待解决。

那么,现有劳动力技能、数据范围和质量的壁垒可以得到解决的依据是什么?Jim Tung认为,非常重要的一点是,越来越多的工程师和科学家正在参与到AI项目中,而不仅限于数学科学家,他们将带来AI项目成功所必需的领域技能和知识。这些科学家能够很好地获取现有深度学习的预训练模型,包括AI社区已经公开的研究成果。利用传感器数据将更有利于这些AI模型的应用,不仅限于深度学习常用的图像数据,还包括时间序列、文本以及雷达信号等各方面数据。这些数据和模型的可用性,将支持AI在更多领域的广泛应用。
 
工程师和科学家能够充分利用自己对数据的了解,这将对AI项目的成功带来很大影响。例如数据自动标注的工具,可以帮助他们加快这种高质量大型数据集的准备工作。高质量数据越多,AI模型准确度提高的可能性也越大,从而整个项目的成功概率也越高。
 
趋势二:AI驱动系统进一步提升设计复杂度
 
工程师们并不满足于在IT系统中的应用,正在将AI推广到各种系统中,包括自动驾驶汽车、飞机引擎,以及工业厂房和风力发电机等等。AI模型的行为在一个多域的复杂系统中,会对整个系统的行为产生很大的影响。因此工程师们确实需要理解AI模型和系统的其他部分是如何配合工作的。他们期望使用基于模型设计的方法,通过仿真、AI模型的集成以及持续测试理解如何创建稳健的AI驱动系统。
 
AI模型的用途也越来越广泛,并不局限于汽车和工业设备等一些常见的工业领域,还包括其他所有涉及嵌入式系统、边缘计算,以及企业系统的领域。
 
当设计越来越复杂,AI模型应用越来越广泛时,又该如何进行AI驱动的系统设计?Jim Tung表示,重要的一点是要将AI模型放在系统级的语境中,在移植入硬件之前先对AI算法的行为进行仿真,判断是否符合预期,并验证基于AI设计的有效性。
 
一个示例是Voyage,他们将自动驾驶算法嵌入车辆中,为老人护理机构提供服务,仅仅在3个月内,就实现了Level3级别的无人驾驶汽车开发。正是因为基于模型的设计集成了AI功能和汽车的其他子系统,从而能够快速地理解系统行为。
 
趋势三:在低功耗、低成本嵌入式设备中部署AI愈加容易
 
AI系统在低功耗、低成本的嵌入式设备中更容易部署,这有利于AI模型在工业领域的应用。以往AI算法需要具备32位浮点运算能力的高性能计算系统,GPU、集群以及数据中心支持。现在,随着软件工具的发展,可以设计基于不同级别定点运算的AI推断模型,并将其部署到不同的低成本、低功耗的嵌入式设备中,这使得工程师能够在应用AI技术时有更多选择,例如车辆的ECU电子控制单元以及更多的嵌入式工业设备等。
 
将AI算法应用在不同的嵌入式处理器中,以往的工作模式通常是算法或模型开发者和程序员合作。如今通过使用软件工具,特别是自动代码生成功能,可以在开发一次模型后,使用代码生成功能将其部署到各种不同的平台上,例如生成C++代码,或生成CUDA代码应用于GPU,以及HDL代码,应用在FPGA上,一个来源、多个目标,全部自动实现。
 
不过,将浮点运算转换为定点运算,并不能一蹴而就,这要求对代码有很好的理解,以保证结果可预测并可靠。

 
趋势四:强化学习从游戏转移到工业场景中
 
强化学习因为在游戏领域得到广泛应用而闻名,现在它已快速转移到现实世界的工业应用场景中。原因在于强化学习能够快速地帮助工程师解决复杂问题,例如在自动驾驶、自主系统,以及控制设计、机器人等领域。
 
为了实现强化学习,需要进行大量的模拟。仿真的重要性在于,每一次模型仿真的结果都用于学习,可以执行多次仿真,也可以在云端和集群中进行并行计算,来提高学习速度。
 
为迎合这一趋势,MathWorks开发了强化学习工具箱,支持内置和自定义的强化学习智能体的应用。在MATLAB和Simulink中,用户可以对环境进行建模,这是强化学习工作流的重要部分。同样深度学习工具箱也支持强化学习策略的设计,GPU、云端训练加速功能、嵌入式系统的代码生成,以及供用户快速进行项目开发的参考示例。

 
趋势五:仿真可以降低数据质量欠佳壁垒
 
数据质量是AI成功实施的主要壁垒,通过仿真可以有效解决这一难题。为什么?Jim Tung分析,AI本可以在检测故障、异常和失效情况的场景中十分有用,但问题在于,对故障状态进行数据收集,可能有很高的风险且难以预测。一方面因为故障发生概率不高,另一方面收集数据的代价十分高昂,因为需要让设备运行到出现故障,这样难以收集到大量有效数据。
 
但是,如果通过仿真来呈现系统的故障行为,从而生成相应的数据,再结合实际的传感器数据,可以对AI模型进行训练来提高准确度。通过采用基于模型设计流程中开发的模型,对其进行调整,来模仿故障模式。这些故障模式的模型可以仿真生成大量数据来描述故障状态,用于训练AI模型以及故障检测。
 
非AI领域专家是AI项目成功的关键,他们需要哪些工程支持?
 
Jim Tung认为,基于这五大趋势,2020年将是十分重要的一年。“AI驱动系统”将是一个非常重要的方向,尤其在工业应用领域。通过跨科学与工程和数据科学的工具,使用跨越整个设计流程的工具链,将AI模型与科学和工程的洞见相结合,都在降低AI的实施难度。
 
正如他在采访中所强调的工程师和领域专家对于AI项目至关重要,相关工具顺应趋势发生变化。如今,用于构建基于AI的解决方案的工具正在从针对数据科学家的工具扩展到针对专业工程人员的工具。借助这些工具,工程师可以将AI驱动的功能和模型注入应用程序,而无需专业数据科学家的参与。
 
Jim Tung告诉《电子发烧友》,一个最新的用户案例是复旦大学利用MATLAB开发相应的数学模型来预测新冠肺炎的传染趋势,并为官方提供了相应的公共措施方面的指导。MATLAB在该项目中的主要应用有:数据的可视化、预处理,模型的拟合、开发,参数的调优,数值仿真和测试,应用程序的开发,最终以Web应用的形式部署。

相关领域的专家对AI项目的成功至关重要。他们能够利用自己的专长选择合适的数据,决定如何为AI建模准备数据,选择针对应用简化且有效的模型。并且,他们还能够通过评估结果判断模型是否合适,以及理解系统并识别在系统中可能出现的故障模式。
 
他们需要哪些工程支持?首先,使用应用程序和自动化工具准备标注完善的数据集;其次,完备的算法和内置预训练模型,便于快速访问;第三,针对一些特定的垂直应用领域,例如预测性维护等,提供内置的算法,可以帮助他们快速开发;第四,通过参考示例了解AI在不同领域的应用,可以根据这些参考示例,结合各自需求进行修改。
 
为了帮助非AI领域专家有效使用相关技术,MathWorks提供了一系列应用程序,例如在深度学习工作流中的应用Deep Network Designer,支持用户直接获取预训练模型、导入网络、训练图像分类网络、并生成MATLAB代码用于后续的自动训练,都是以按键点击的方式来执行,在应用程序引导下,他们可以完成工作流中的设计和分析等各个步骤。
 
同时,MATLAB提供了完整的软件功能,包括当前的领先技术。例如AutoML,可以通过自动化的方式实现在机器学习中的各个步骤,包括特征生成、特征选择以及模型选择等,同时也可以将AI与其他技术结合,包括信号处理、图像处理以及优化,用户还能够创建自定义的方法,并且结合使用其他语言开发的方法,进行集成。
 
找到工业企业对AI的痛点需求
 
既然今年有望成为工业应用的“AI驱动系统”年,那么,找到工业企业对于AI的痛点需求显然至关重要。由于传统工业企业在AI的实施中普遍偏保守,他们对于新技术的选择往往非常谨慎,需要确定生产系统是稳健的,需要足够的经验积累。这些都造成了AI在工业领域难以快速落地的局面。
 
Jim Tung结合他的观察谈到,在数字化浪潮中,传统企业并未抗拒变革,一些企业在几年前就开始了数字化转型,但是大多数以失败或进展迟滞告终。常见的失败模式有两种:一是花了太多时间为所需数据构建IT基础设施,但最后发现方向是错误的,以至于耗费了过高的时间、人力和费用成本。二是一些企业尝试跃进式的转变,试图从传统的商业模式直接切换到全新的商业模式,招了大量新人、收集新想法,但是反而在某些情况下流失了现有人才。
 
Jim Tung认为,那些能够成功进行数字化转型的企业,往往非常务实。首先他们能找出一些特定项目,以此为起点进行管理,逐步递增。项目体量适当,既具有足够的挑战性,能产生投资回报,又不会风险过高。他们通过已经积累的经验和资源,系统地使用工具、工作流和模型,是一种更系统且成功概率更高的方式,更有助于实现转型。
 
他强调,AI在工业应用中成功的最重要的因素,在于充分地利用领域专家们的经验积累。他们能利用在创建、维护系统时所积累的专业知识,同时结合数据科学和AI知识。企业可以雇佣具有这方面专业技能的新人或者帮助领域专家提高他们在数据科学方面的技能。如果把这两个群体分开,尝试各自去解决问题,往往难以成功。
 
帮助用户管理和优化资产是当前AI工业应用的重点
 
眼下,人工智能的主要问题仍是如何在实际应用中投入生产。作为软件工具提供商,MathWorks主要从以下四方面应对挑战:一是当负责生产的团队对AI开发的细节不太精通时,例如选择模型类型、调整超参数、评估性能等有困难,可以使用AutoML方法将这些步骤自动化,这是关键的实现方法;二是缺乏生产系统需要运行的一系列场景的综合数据集,将AI开发工具与系统仿真工具相结合,能够合成数据,并通过并行运行仿真加速,有助于克服这一挑战;三是AI组件通常需要在功耗和计算受限的系统中运行,因此提供功能强大、易于使用的工具来量化在此类系统中运行的神经网络至关重要;最后,识别一个有效的深度学习网络需要大量的实验,包括训练、调整超参数、比较结果和管理不同的数据集,系统地做到这一点并跟踪每件事可能是一个挑战,为此MathWorks引入了Experiment Manager(实验管理器),帮助用户运行和组织他们的深度学习实验。
 
在Gartner刚公布的《2020年数据科学和机器学习平台魔力象限》中,MathWorks被评为领导者。Jim Tung表示,未来,越来越多的数据将来自于机器和硬件资产,AI的应用前景不仅体现在商业数据挖掘上,更重要的是怎样管理和优化资产。MathWorks主要关注工业用户,即那些建造并提供实际的物理设备、机器、汽车的企业等,帮助他们以更简单、有效的方式实现AI应用。

 
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分