存储技术
(文章来源:比特网)
如今的人工智能和深度学习应用程序中使用了大数据集和快速I/O技术,但数据存储可能会导致性能问题。人们需要了解人工智能和深度学习存储系统应该具备哪些功能。
人工智能技术广泛应用在机器学习和深度学习中,已经引发了研究和产品开发的爆炸性增长,因为企业发现了创造性的方法,将这些新算法用于过程自动化和预测性见解的创新方法。机器学习和深度学习模型的本质要求获取、准备、移动和处理大量数据集,后者通常模拟大脑的神经结构和连接性。
特别是深度学习模型需要大量数据集,这对于人工智能和深度学习的存储是一种独特的挑战。简要介绍机器学习和深度学习软件的本质,将会揭示存储系统对于这些算法如此重要以提供及时准确结果的塬因。为什幺人工智能和深度学习的存储很重要,许多研究者已经证明,随着数据集的增加,深度学习模型的准确性也会提高。这一改进意义重大,研究人员经常使用复杂的数据增强技术来综合生成额外的数据用于模型训练。
例如,用于对各种深度学习图像分类算法进行基准测试的ImageNet数据集包含超过1400万张具有大量注释的图像。虽然经常用于对图像分类硬件进行基准测试的ResNet-50模型的大小刚好超过100MB。这些模型最好保存在内存中,必须不断地提供数据,这通常会导致存储系统成为整体性能的瓶颈。
深度学习存储系统设计必须在各种数据类型和深度学习模型之间提供平衡的性能。无论模型和应用如何,深度学习包括两个步骤:模型训练和数据推理。训练是在使用训练数据集进行重复的、通常是递归的计算的基础上计算和优化模型参数的过程。数据推理是在新的输入数据上使用经过训练的模型进行分类和预测的地方。
每个步骤都会以不同的方式强调为人工智能和深度学习提供存储的系统。通过训练,其压力源于大型数据集和对计算复合体(通常是分布式集群)的快速I/O,这是可接受性能所必需的。通过推理,其压力来自数据的实时性,必须以最小的延迟处理这些数据。
(责任编辑:fqj)
全部0条评论
快来发表一下你的评论吧 !