微软和英特尔合作探索利用深度学习训练框架检测和分类恶意软件方法

枫雪路 2020-05-12 3230

电子说

1.4w人已加入

描述

5月12日消息，微软和英特尔宣布合作，探索一种新的检测和分类恶意软件的方法。该项目被称为STAMINA（STAtic Malware-as-Image Network Analysis），该项目依靠一种新技术，将恶意软件样本转换为灰度图像，然后对图像进行扫描，以获取特定于恶意软件样本的纹理和结构模式。

此前，微软团队推出了一个新的深度学习加速平台，其代号为脑波计划（Project Brainwave），机器之心将简要介绍该计划。脑波计划在深度学习模型云服务方面实现了性能与灵活性的巨大提升。微软专为实时人工智能设计了该系统，它可以超低延迟地处理接收到的请求。云基础架构也可以处理实时数据流，如搜索查询、视频、传感器流，或者与用户的交互，因此实时 AI 变的越发重要。

近年，人工智能从概念逐步实现市场化，众多该领域的国际巨头企业将开源深度学习软件框架作为打造开发及使用生态核心的核心。总体来说开源软件框架在模型库建设及调用功能方面具有相当共性，但同时又各具特点。业界目前主要有深度学习训练软件框架和推断软件框架两大类别。

基于深度学习的训练框架主要实现对海量数据的读取、处理及训练，主要部署在 CPU 及 GPU 服务集群，主要侧重于海量训练模型实现、系统稳定性及多硬件并行计算优化等方面的任务。目前主流的深度学习训练软件框架主要有 TensorFlow，MXNet，Caffe/2+PyTorch等。

TensorFlow 以其功能全面，兼容性广泛和生态完备而著称。该软件框架由谷歌大脑（Google Brain）团队主要支撑，实现了多 GPU上运行深度学习模型的功能，可以提供数据流水线的使用程序，并具有模型检查，可视化和序列化的配套模块。其生态系统已经成为深度学习开源软件框架大的活跃社区。

MXNet 以其优异性能及全面的平台支持而著称。该软件框架是由亚马逊公司（Amazon）主导的深度学习平台，目前已经捐献到阿帕奇软件基金会（Apache）进行孵化。其主要特点包括：一是可以在全硬件平台（包括手机端）运行，提供包括 Python、R 语言、Julia、C++、Scala、Matlab 以及 Javascript 的编程接口；二是具有灵活的编程模型，支持命令式和符号式编程模型；三是从云端到客户端可移植，可运行于多 CPU、多 GPU、集群、服务器、工作站及移动智能手机；四是支持本地分布式训练，在多 CPU/GPU 设备上的分布式训练，使其可充分利用计算集群的规模优势。

Caffe/2+PyTorch 以其在图像处理领域的深耕和易用性而著称。该软件框架是由脸书公司（Facebook）主导的平台，目前 Caffe 1/2两个项目已经合并到 PyTorch 统一维护。在图像处理领域 Caffe有着深厚的生态积累，结合 PyTorch 作为一个易用性很强的软件框架，越来越受到数据科学家的喜爱。我国很多人工智能图像处理团队选择PyTorch 作为主要工作平台。

Microsoft Cognitive Toolkit （CNTK）以其在智能语音语义领域的优势及良好性能而著称。该软件框架由微软公司于 2016 年基于 MIT协议开源，它具有速度快、可扩展性强、商业级质量高以及 C++和Python 兼容性好等优点，支持各种神经网络模型、异构及分布式计算，依托于微软的产品生态，在语音识别、机器翻译、类别分析、图像识别、图像字幕、文本处理、语言理解和语言建模等领域都拥有良好应用。

PaddlePaddle 以其易用性和支持工业级应用而著称。该软件框架是百度旗下的深度学习开源平台，是我国自主开发软件框架代表。其大特点就是易用性，得益于其对算法的封装，对于现成算法（卷积神经网络 VGG、深度残差网络 ResNet、长短期记忆网络 LSTM 等）的使用可以直接执行命令替换数据进行训练。非常适合需要成熟稳定的模型来处理新数据的情况。

除上之外，业界及学术界还存在着多个机器学习及深度学习软件框架，如 Scikit-learn，Theano 等。这些软件框架在其专长领域仍然发挥重要作用。但由于各软件框架的维护力量及发展思路不同，同时缺少贡献人员，导致软件框架发展水平略显滞后，存在着包括算法库扩展不及时，API 水平较低以及不支持分布式任务等问题。

责任编辑：gt

打开APP阅读更多精彩内容