AI重构工业视觉 | 阿丘科技受邀中信证券产业策略会精选问答

描述

近日,阿丘科技 CEO 黄耀受邀出席参与了由中信证劵举办的"独角兽十问十答"产业策略会,以 "AI重构工业视觉"为主题,分享了工业视觉领域市场发展现状,当前AI 对工业视觉领域的影响和应用,以及剖析了未来 AI 在工业视觉领域的发展思想、新观点、新路径等。

 

以下为精简版纪要

 

Q1

从技术角度看,AI将如何影响工业视觉?

一、维度提升,优化复杂问题的处理能力Rule-based的方法受人工设计特征工程的维度限制,而深度神经网络可实现维度的量级提升。以大模型为例,可达到一千亿、二千亿的参数空间维度,高维度下处理复杂问题更为简便。

二、性能改进:一方面,降低现场运维成本,受传统Rule-based技术的瓶颈限制,现有AOI设备为保持低漏检率与低过杀率,需进行人工复判;AI可进一步减少对人力的依赖,进而提升成本效益。另一方面,在产品层面重构用户的交互体验,简化操作流程。传统的工业视觉依赖于Halcon或康耐视的Vision Pro,需对数百个算子进行预处理,工序复杂;而阿丘的AIDI软件只有五个核心模块,强调易用性。工业基础视觉软件正在从Software 1.0 迈向 2.0,从Rule-based变成Smart Software后,用户体验发生质的飞跃。

三、通用泛化:实现跨领域通用,赋能碎片化工业视觉市场整合。工业领域包含电子、汽车、医药等众多细分赛道,单一品类的市场容量不大,但多行业整合后的市场空间巨大。AI的通用泛化能力可推动解决工业视觉领域的第一性原理问题:如何实现碎片化市场的最大化覆盖。

 

Q2

从商业模式角度,AI将如何影响工业视觉?

一、降低门槛,不再需要资深算法工程师进行检测与复杂的应用,从业者只需对行业与软件有基本认知即可;
 

二、重塑成本结构,研发成本降低,交付运维成本降低,短期内尤其是AI进入一个行业的早期阶段会增加数据成本(包括数据维护或数据标注成本),但随着时间会不断降低,最终会走向基础模型。未来三年整个行业的成本结构将大幅优化。

 

Q3

AI+工业视觉目前处于什么阶段?

一、AI 1.0阶段,核心为以算法为中心。1.0阶段的算法特征为小样本、高精度、低算力;落地方法论关注AI认知、需求边界、数据与模型的管理;客户群体普遍存在痛点,愿意拥抱新技术且有一定支付能力。主要问题为数据缺乏,上线部署周期长,如遇未知缺陷必须重新训练,研发成本与定价偏高。

二、AI 2.0阶段,核心为以数据为中心。一是开始累积行业数据,这是2.0阶段的重点。某场景下的客户达到一定数量后,累积的数据可协助在基础模型上针对不同客户的需求进行微调。二是形成工业 AI 视觉的标准化平台,减少对人工的依赖。三是完善数据清洗、数据生成、分析辅助的工具链。2.0阶段产品易用性将大幅提升,同时成本进一步下降,客户关注性价比。此外,大规模的AI运行 scale up & scale out、场景复制和迁移泛化的问题是本阶段的重点议题。

目前,阿丘正处于从1.0迈向2.0的上半场。整体而言,当前AI在工业视觉领域仍属于逐步加速渗透的过程,预计到2024、2025年之后将开始加速普及。

 

Q4

工业视觉下游场景众多,各自有什么特点?

一、最上层为半导体、面板与PCB特点是工艺属性强,不仅依赖技术能力,典型公司如KLA。该领域存在重大机会。

二、腰部市场,如汽车、电子、新能源领域。具有两个典型特点:

1)极具创新力,以电池为例,有磷酸铁锂、三元电池、氢燃料电池、固态电池等多种形态。除头部公司外,不断有创业公司用颠覆性的创新方法重塑行业;

2)竞争激烈,市场规模大且快速变化,靠近消费者,难以形成一套标准解决方案。腰部市场需秉持解耦的理念,追求碎片化市场的覆盖

三、传统行业,如食品、金属加工等。特点是节奏慢,认知度不佳,客户较少关注底层技术,更为关注解决具体问题的速度与产品易用性。因此在这类市场,产品力是制胜的关键点,而形成产品力的关键要素是易用性与快速部署。

 

Q5

除了仿真技术手段之外,还有什么方法可以加速corner cases的收集?

第一种方法是最早期采用的通过人为制造缺陷或PS缺陷数据,即与客户商讨该缺陷的特征和表现,以便公司能够准确了解其特点。然而,这种方法存在一个问题,即如果客户不提供足够的信息,我们将无法准确了解该缺陷。因此,这种方法在早期使用较多,但后来逐渐减少。
 

第二种方法是利用AIGC来进行缺陷生成,通过模拟和生成缺陷的特征来解决问题。这种方法可以有效应对缺陷背后的复杂性,并且可以生成各种不同类型的缺陷,这是目前常用的一种方法。

第三种方法是利用非监督学习的方式,使用OK品进行建模。这种方法可以帮助公司更好地理解缺陷的特征和模式,从而提高缺陷检测和修复的效果。

 

Q6

如何看待大模型对工业视觉领域的影响?

大模型是相对概念,用“基础模型”描述更为准确。基础模型包含两层概念:
 

1)通用基础模型,如SAM,能够解决通用问题,但是解决方案较为粗略,在工业场景中无法直接使用。

2)行业基础模型,如针对PCB行业的基础模型或预制模型,阿丘已在这类模型中取得进展并实现商业化落地。

另一方面,大模型不能通吃一切,其可能符合To C端的通用需求,并诞生相应的公司。但对于To B类或垂类需求,会出现垂类的基础模型(小模型)。最终的生态将是大模型+垂类的细分模型并存。

 

Q7

CV领域什么时候会迎来“ChatGPT时刻”?

目前在工业视觉的实际应用中,AI的应用仍属于上一波的技术阶段,主要是深度卷积神经网络,其中神经网络层数大约为20-30层或30-50层,根据具体情况进行选择。
 

CV领域的“ChatGPT时刻”目前还没有出现,颠覆性创新技术出现的时间具有不可预测性。Meta提出了SAM,得到资本市场疯狂追捧,事实上只是迈出了一小步,CV领域的大模型依然需要一段时间。公司认为,CV领域一定会出现自己的ChatGPT,大概率由技术路线清晰的头部大模型公司引领。

 

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分