电子说
人工智能,或称人工智能,让我们在自拍时看起来更好,当我们向Alexa询问天气情况时,会顺从地告诉我们天气,并推动自动驾驶汽车的发展。正是这项技术使机器能够从经验中学习并执行类似于人类的任务。
作为一个整体,人工智能包含许多子领域,包括自然语言处理、计算机视觉和深度学习。大多数时候,工作中的具体技术是机器学习,它专注于开发分析数据和做出预测的算法,并且在很大程度上依赖于人类的监督。
SMU信息系统助理教授孙乾茹将训练一个小规模的人工智能模型比作教小孩子识别周围的物体。“一开始一个孩子不了解他周围的很多事情。他可能看到一个苹果,但不知道它是苹果,他可能会问,这是香蕉吗?他的父母会纠正他,不,这不是香蕉。这是一个苹果。这样的反馈在他的大脑中,然后信号微调他的知识。”
孙教授的研究主要集中在深度卷积神经网络、元学习、增量学习、半监督学习以及它们在图像和视频识别中的应用。
训练人工智能模型
由于人工智能的复杂性,孙教授在潜入研究项目之前,先对该领域的一般概念和当前趋势进行了探讨。
她解释说,有监督的机器学习涉及到模型本身在一个标记的数据集上进行训练。也就是说,数据被标记为模型正在构建以确定的信息,这些信息甚至可以按照模型应该分类为数据的方式进行分类。例如,一个设计用来识别苹果的计算机视觉模型可能会在一组不同的苹果图像上进行训练。
给它数据,数据就有标签,她解释道一张图片可能包含一个苹果,该图片通过深度人工智能模型进行一些预测。如果预测是对的,那就没事了。否则,该模型将得到计算损失或惩罚,通过反向传播来修改其参数。所以模型会不断更新。
孙教授观察到,目前最先进或性能最好的人工智能模型几乎都是基于深度学习模型的。在深度学习中,该模型基于包含许多层的深度神经网络结构,从图像、文本或声音中学习执行识别任务。例如,如果输入是图像,则假设图像可以由不同的空间尺度或特征层来描述。
孙教授举例说:“以我的脸为例。区别于其他人的特征是我的眼睛、鼻子、嘴巴作为局部特征,脸型和肤色作为全局特征。对于识别,我可以用这些特征来表示“这就是我”。对于机器模型,它在不同的层中对这些局部和全局特征进行编码,从而可以进行相同的识别。”
训练人工智能模型需要大量的数据才能准确识别。她认为,如果一个人工智能模型只有一张人脸图像,那么它在识别这个人时就会出错,因为它看不到其他面部特征,而这些特征正是这个人区别于其他人的面部特征外观有差异,人工智能依赖于高度不同的数据集,以便了解图像的所有差异。
健康促进应用程序
孙教授正在研究的项目之一是Food AI++,这是新加坡健康促进委员会(HPB)的一个应用程序。用户只需用手机拍下正在吃的食物的照片,就可以确定食物成分数据。该应用程序的目的是帮助用户跟踪所食用食物的营养,并利用这些信息实现健康、均衡的饮食。
孙教授和她的团队收集用户用餐时拍摄的图像数据并上传到应用程序中。观察发现,食物图像非常嘈杂和多样,反映了不同的文化。
例如,新加坡的华人和马来人有不同的饮食习惯、饮食风格和不同的食物种类,她澄清道当我们训练一个模型时,我们从有限的类别列表开始,但是对于food应用程序,我们发现我们必须在应用程序编程接口(API)中一直扩展这些类别。我们必须不断地修改和更新数据集。新加坡丰富的文化多样性是该项目最大的挑战之一。
除了收集更多不同的数据外,该团队还在研究领域自适应学习算法。在不同的文化背景下,有不同的领域,因此他们必须考虑如何通过利用有效的学习算法,快速调整他们预先训练的模型。为了对食物图像进行这种处理,他们需要开发特定于食物的域自适应算法。他们还需要考虑将食品知识包括在内,以提高多领域模型的整体效率。
“我们希望通过在新领域中使用一个小数据集来进行这种调整。”孙教授说这是一项具有挑战性的任务,它将使来自不同文化的新加坡用户受益。
AME的FANN项目
孙教授目前正处于一个名为“先进人工智能系统的快速适应神经网络(FANN)”的三年项目的早期阶段。该项目由美国科学技术研究局(a*STAR)在其先进制造与工程青年个人研究基金(AME YIRG)下资助,主要研究计算机视觉例如图像处理,图像识别,或者视频中的目标检测。计算机视觉算法通常依赖于卷积神经网络(CNNs),这是她的专长领域。
“这项研究的关键假设是,有可能建立基于统计水平知识学习的模型适应推理水平,通过验证这一假设,我们也正在接近高级人工智能系统的目标,该系统可以为AME领域的应用训练具有类人智能的机器模型。”
该研究旨在实现自动化视觉检测的高鲁棒性和计算效率,以及精密制造和先进图像识别技术之间的交叉知识。孙教授相信,当快速适配检测装置广泛应用于生产线的设计、布局、制造、装配和测试过程时,研究成果将大大提高成品率,降低制造成本。
编辑:lyn
全部0条评论
快来发表一下你的评论吧 !