2016年,AlphaGo对人类顶尖围棋手的无差别“虐杀”,又一次引发了大众对AI技术的关注和恐惧。
在大部分人都热衷于讨论AI技术是否会真的全方位超越人类,进而对人类产生重大威胁时,有一群人却因为看到其背后突破性的机器学习技术而深感兴奋。
在他们看来,AI机器威胁到人类还是一个遥不可及的未来,眼下最重要的是如何把AI变成“新工人”,来帮助人类解决那些迟迟没有找到好方案的问题。
产品检测就是这样一个急切需要新技术的老问题。
尽管企业很早就利用工业相机等数据采集设备对产品实施检测,但是采集到的数据还是要通过人工识别和判定,效率低不说,质量稳定性也难以保证。
机器学习算法的突破,提供了一种可能性,就是基于过往积累的数据训练AI模型,然后让其自主判定产线相关检测数据,进而克服人工判定的低效与高错误率等问题。
由此,传统制造业向智能化转型升级的大门,借由AI+机器视觉开启了一道缝隙,让遥远的光亮照了进来,让行业前进的道路逐渐明朗了起来。
时隔6年多后,机器视觉这项技术发展到了什么程度?相关企业利用AI技术如何打造自己机器视觉产品的独特性?并如何实现商业落地?在这个过程中,又会遭遇怎样的阻碍?透过机器视觉的发展,能够给我们看待AI赋能传统制造业的转型升级提供怎样的启发?
为了寻求上述问题的答案,智次方·物联网智库分别采访了格创东智科技有限公司AOI产品商务负责人江渊总和菲特(天津)检测技术有限公司研发总监陈立名总,通过与两位长期浸淫在战斗最前线的专家的深度交流,尽可能全面地了解机器视觉技术的发展路径,并在此基础上管窥智能制造的发展现状和方向。
什么是机器视觉?
根据美国自动成像协会(AIA)的定义:机器视觉(Machine Vision)是一种应用于工业和非工业领域的硬件和软件组合,它基于捕获并处理的图像为设备执行其功能提供操作指导。
机器视觉可以分为成像和图像处理分析两大部分:成像依赖于机器视觉系统的硬件组件,如光源、光源控制器、镜头和相机;图像处理分析则是在成像基础上,通过视觉控制系统进行的。
机器视觉系统的核心功能包括:识别、测量、定位和检测。
上述功能的难度是逐次递增的,因此,生产检测也是最能展现机器视觉“功力”的领域之一。
2023年12月12日,工信部联合发改委和金融监管总局发布了《制造业卓越质量工程实施意见》通知。
通知中强调,质量是制造业的生命线,卓越的质量是高端制造的准则,推动产业从数量扩张向质量提升是新时期制造业高质量发展的现实需要,追求卓越质量是制造业由大变强的必由之路。
在这一定位下,通知中提出要推进质量保障数字化……推动企业加强试验验证、检验检测数字化和智能化,深化机器视觉、人工智能等技术应用,提高质量检验检测的效率、覆盖率和准确性。
在这样一个背景下再看机器视觉技术,其重要性不言而喻。
目前,机器视觉技术已经广泛应用于消费电子、汽车制造、半导体、光伏等领域,且市场规模在不断扩大。
据Markets and Markets统计和预测,2021年全球机器视觉市场规模为804亿元,2025年有望达到1276亿元。根据高工机器人产业研究所数据,2021年中国机器视觉市场规模达到138.16亿元,到2025年我国机器视觉市场规模将达到469亿元,2021-2025年复合增速达到36%。前瞻产业研究院预测,至2028年,中国机器视觉行业市场规模将达到亿837元。
格创东智科技有限公司和菲特(天津)检测技术有限公司自2017年起,各自开启了AI+机器视觉的创新之旅。虽然两家企业从不同的地点出发,经历了截然不同的探索过程,但从更宏观的技术发展视角来看,却又给人一种殊途同归的感觉。
接下来,我们将分别进行介绍。
格创东智——从具体场景中走出来的企业
2018年,格创东智由TCL孵化而出。带着TCL在解决特定问题上积累的数字化能力,并以此为基础发展出一系列相关产品和解决方案。
这样的企业具备一个天然优势,就是拥有深厚的行业Know-How,不同于一些AI企业是带着技术去找场景和客户,他们本身就是具体场景孕育的结果,所以甫一降生,就带有很好的理解场景和客户需求的基因。
格创东智的机器视觉检测方案——天枢AI视觉检测系统是其工业智能解决方案中的一个细小分支,源自TCL华星的半导体生产检测。
据江渊介绍,面板生产过程的每一个关键制程都需要AOI(自动光学检测)设备拍摄图片,进而识别相关缺陷。早期通过人工进行缺陷分类,只有分类好了,才能知道下一步该怎么处理。整个流程有一百多个制程,需要大量的人工去做每一个关键制程。
2017年,机器视觉技术兴起后,TCL华星内部开发了AI视觉检测系统,基于人工智能技术进行图片的识别分类。
方案实施后,首先是大幅提升了检测效率,能够代替百分之八九十的检测人员,一天可以检测将近三百多万张图片。其次是提升了检测精度,因为能够有效避免人员易疲劳、人与人之间的认知差异等问题。
此后,随着技术成熟度的提升,格创东智的机器视觉方案逐步从半导体行业外溢,目前已经成功赋能光伏、3C电子、家电、石油石化、航空航天等22个细分行业。
AI模型是如何赋能生产制造的?
从采访中我们也了解到,AI赋能机器视觉检测的过程,经历了一个从小模型到大模型,再到“小模型”的路径。
初期,格创东智先结合深厚的行业数据积累和对特定工业场景及检测指标的深入理解,再融合机器学习算法,构筑了针对特定检测场景的小模型。
小模型的构建旨在紧密匹配特定的业务场景和需求,强调的是针对性和高适应性。通过专注和定制化的开发过程,小模型能够在满足行业特定需求的同时,提高操作效率和决策质量。
但是,小模型存在过拟合的风险,即模型太过专注于训练数据集中的细节和噪声,以至于它在新的、未见过的数据上表现得不好。这使得其落地前提是必须对数据进行规范化和标准化,使得数据分布和比例达到最佳状态。模型的开发和调优需要专业人员的参与,要求他们既熟悉AI技术,也了解行业专业背景知识。
而很多客户企业并没有这样的人才储备。
2022年,大模型技术的突破给上述问题的解决带来了希望。
相比于小模型,大模型有更强的兼容性和稳定性。大模型的设计不受数据复杂性的限制,无需对场景理解过于深入,只需足够多的数据进行训练,无需过多的参数调整或架构设计。在更加简便地处理各种类型的数据的同时,还不会出现过拟合的现象。
概言之,大模型的出现可以大幅降低模型落地的门槛。
长期思索于如何将机器视觉系统变得更好、更容易落地的格创东智积极响应大模型的技术潮流,基于已有的大量数据和小模型来训练和开发自己的大模型。
但是要直接把大模型落地在客户侧又存在新的问题,就是在实时工业场景中推理需求的高资源消耗与成本压力难以满足连续快速检测与生产流程的无缝对接。
格创东智的解决办法是,先在内部训练大模型,而后再针对特定场景进行“模型瘦身”。这样做的好处是,利用大模型进行学习和提取特征,可以更高效地训练出小模型,训练过程中所需的数据量也大幅减少,使得模型的落地应用变得更加便捷和可行。
此外,江渊也介绍到,为了提高产品交付性,他们的天枢AI视觉检测系统还开发了可视化功能,通过将模型开发过程简化为直观的拖拉拽操作,使得非AI专家的普通IT人员也能轻松开发和优化AI模型。
客户可以从一系列预设的子模型和算法中选择,通过简单的操作将它们组合起来,构建出满足特定需求的模型,无需深入了解背后复杂的算法细节。
这样一来,很多客户企业无需额外投入巨大的人力成本,就可以享用到最新的机器视觉技术的赋能。
这种时刻从客户场景入手,不断在产品落地和交付性方面死磕的精神,正是格创东智这种从具体场景中孕育而出的企业最大的特点,也是他们的最大优势。
菲特——国家重点“专精特新”小巨人
不同于格创东智的机器视觉检测方案,是在一个大的工业智能解决方案基座上延伸出来的一个枝节。
成立于2013年的菲特(天津)检测技术有限公司则是从检测这个点出发,在产业实践过程中不断积累和丰富技术经验,逐渐衍生出新的能力,从质量智能逐步到工厂智能,进而在更为广泛的工业智能中发光发热。
国家级重点“专精特新”小巨人的称号,便是对其十年磨一剑最好的肯定。
笔者曾在文章中提到过,专精特新企业的目的不在于主导市场,让自己成为家喻户晓的知名企业,而是更加关注小生态位的主导权。通过产品创新和深耕市场,构筑具有绝对优势的竞争壁垒,让自己成为某个产业链中必不可少的基本要素。
概言之,如果一家企业挂上了“专精特新”的牌子,那也意味着在其耕耘的领域,他已经具备了相当深厚的积累和话语权。
从陈立名的介绍中我们了解到,菲特也积极抓住了2017年的机器学习浪潮,着手于将此前已经积累的大量数据用于模型训练,这些模型专门针对质量检测领域的需求,满足特定行业检测标准的同时实现最大化的成本控制。
在后续的发展中,菲特尝试将AI技术应用于更多的工业场景,最后形成了四个主要的应用方向:生产智能、质量智能、物流智能、安全智能。
这四大领域覆盖了从生产前端到后端的全过程,先后为整车、零部件、化纺、医药、军工、泛工业等领域内的众多全球知名企业提供了整体智能制造解决方案,真正为客户企业实现提质增效。
一条独特的研发路径:技术-中台-产品
陈立名提到,为了支撑上述四大业务领域的发展,菲特采用了分层研发策略,包括核心技术层、标准化技术的中台层和产品层。
核心技术层是企业为未来五年的技术储备而进行的顶级研发工作。这一层面的研发活动集中在创新和拓展技术边界,比如2D和3D测量技术等,其目的是要实现在线级(即落地到实际的生产线上)微米级别的精确度。
标准化技术的中台层是指通过汇总标准化、模块化的工具和技术,形成中台能力,以应对多变的工业场景和定制化生产需求。这一层面的研发旨在实现技术的可复用性和灵活性,以便快速适应市场和客户需求的变化。
产品层指的是具体的产品开发,包括检测设备和监控系统等,直接面向市场和客户。力图将先进的技术应用到具体的产品设计和功能实现中,使其成为看得见摸得着的成果。
大模型技术浪潮兴起后,菲特也积极响应新趋势。
陈立名提到,对于大模型的发展,他们有一个长期的规划,主要集中在两个方向:
首先,利用大语言模型改进数字化系统的交互方式,从传统的表单和流程,转向更直观、更人性化的交互模式。既包含人与人之间的交互,也涉及知识检索和沉淀,特别是将原本沉淀在个人或零散文件中的行业Know-How,通过大模型技术进行整理和可检索化,以便更有效地复用。
其次,菲特也开始了多模态大模型的开发和应用。通过结合传统的图像数据和文本数据,实现不同数据类型的综合利用,以此来更好地沉淀行业数据。
对谈下来,笔者能够感觉到,菲特对自己的核心要求体现在,他们始终想着如何利用AI技术去帮助客户企业将他们已经拥有的数据资源和行业能力充分利用起来,以此为目标让自己向着国内领先的智能制造整体解决方案提供商迈进。
机器视觉的商业模式
通过与两位技术专家的对谈,我们也对机器视觉的交付方式和商业模式有了更为深入地了解。
江渊提到,格创东智向客户交付的机器视觉检测系统主要涉及三大块内容:硬件、数据算法和后续服务。
硬件部分主要包括光学采集设备和系统设备,这些设备在检测过程中起着重要作用。数据算法与系统集成在一起,提供给客户的是一个整合的系统,客户可以在此基础上进行使用和操作。后续服务通常包括数据算法的优化、调试以及系统的维护和更新等,以确保系统的长期稳定运行。
据江渊介绍,他们与客户的商务合作模式主要分为两类:买断和订阅。
买断指客户一次性购买系统和硬件,之后自行管理,遇到问题再与服务商联系。订阅则是客户购买硬件设备,并订阅公司提供的服务。
商务模式的选择与客户企业的规模和需求有关。对于规模较大、产品类型繁多的企业,可能更倾向于买断模式,以满足不断变化的需求。而对于小型企业,可能更倾向于订阅模式,以降低成本并获得专业的服务支持。
类似的,陈立名介绍到,目前菲特的交付模式主要有三种类型,分别是全套服务交付模式、软件算法服务交付模式和标准化产品交付模式。
全套服务交付模式提供了一个全面的解决方案,包括软件和硬件的整合。公司承担从项目开始到完成的所有工作,类似“交钥匙”工程,即客户从开始到结束不需要担心任何细节问题。
软件算法服务交付模式下,公司专注于提供软件算法方面的服务,而不涉及任何硬件设备。公司的服务主要是赋能客户现有的设备,比如制造设备或质检设备,通过提供高级的软件算法来优化客户的操作流程。
与前两种定制化服务不同,标准化产品交付模式下,公司提供的是成品解决方案,即直接销售标准化的产品给客户。交付过程通常包括现场安装和调试,而所有的后续配合和适配工作则由客户自己或公司的渠道伙伴来完成。
机器视觉方案的推进阻碍
通盘来看,AI+机器视觉带给企业的好处是显而易见的,但这并不意味着相关方案的落地就会水到渠成。在采访中,两位专家也提到了他们在产品推进过程中的一些阻碍以及相对应的策略。
首先,他们面临的最大的问题是所有2B企业都绕不开的问题,即如何给客户算清楚投入产出比这笔帐,只有让客户在数据上看到机器视觉方案带来的显著收益,他们才愿意在前期投入巨大的成本来引进。这需要方案提供商想办法建立标杆案例,提高行业认知度,也让客户更加理解和信任新技术的价值。
其次,很多企业的相关人员对新技术的认知存在一定的局限性,把新技术当成了许愿池和百宝箱,期望引进相关技术方案后,能够一下子解决自己公司面临的所有的问题。面对这一情况,服务商能够做的就是不断沟通和解释,让客户对新技术的认知更加清晰和明确,意识到相关技术的可为和不可为。
此外,数据保密问题也是一个比较大的阻碍。一些关键数据,客户企业一方面是不愿意分享给服务商,这就无法让他们的AI模型发挥作用。一些愿意分享的,也会要求相关开发工作必须在客户现场进行,这又容易出现算力和工程师资源不足等问题。
最后,就是检测指标的问题。客户的期待是,既然都上AI了,那是不是能够做到零漏检和零缺陷,这在当前也很难实现。一方面是故障指标难以形成一个标准化的共识,另一方面就是质量问题与整个生产流程相关,无法通过检测环节去解决所有问题。
总体而言,机器视觉方案的推进难度主要体现在客户认知颗粒度的对齐上,需要服务商不断与客户方沟通和交流,并通过标杆案例等方式,解决客户认知上的偏差和客户期望与实际情况的落差。
写在最后
通过了解机器视觉的发展境况,可以让我们对AI的影响力和落地形式有一个更为直观和具象的了解。它来得并不像技术狂热派所宣扬的那么迅猛和摧枯拉朽,也不像保守者所认为的那样一无是处,只是炒作和概念。
AI技术带来的改变正在一点一滴地发生着,带给我们新希望的同时也伴随着种种待解决的问题。与此同时,技术起作用的关键,从不在于旁观者如何言说,而是依赖于那些始终思考着如何利用新技术去解决老问题的实践者。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !