AI赋能数据科学可不能少了它

阿明观察 发表于 2020-10-16 12:03:46 收藏 已收藏
赞(0) •  评论(0
400万+工程师在用
400万+工程师在用

AI赋能数据科学可不能少了它

阿明观察 发表于 2020-10-16 12:03:46
+关注

不知道从什么时候开始,我们就早已迈入了AI时代。

他们说,进入这个新时代的标志就是电商服务、智能零售、工业制造、智能医疗、智能交通、智能农业、城市安全等百行百业无不开始AI化。

在电商服务领域,通过海量数据的机器学习,AI技术可实现货物自动识别、货物自动分类,优化货物管控的流程,有效提升物流基地的管控效率。

在智能零售领域,比如无人售卖商店、无人售卖机,通过人脸识别技术,借助背后大量的人工智能的算法,以及大数据与高性能设备的支撑,实现了消费者现场拿货品进行自动结算。

在智能生产线领域,智能化工厂应用AI后,可以自动监测到工业制造品的残缺点,并进行标注,有助于提升工业制造的良品率。

在智能医疗领域,依托于大数据的AI技术,通过机器学习分析医疗图像,可以实现快速诊断、癌症筛查。

在智能交通领域,特别是自动驾驶方面,已经贴近大家的生活,AI被充分用于道路识别,便于提升驾驶的安全性。

在智能农业领域,AI应用对农作物成熟度识别、病虫害维护等带来便利。

在城市安全领域,AI+人脸识别方案助力智慧城市建设,提升智慧城市治理能力,带来更好的城市安全。

值得注意的是,在AI应用普及上,行业创新精彩纷呈,同时也带来了大家对AI投资的重视。据相关报告显示,在未来三年,85%的CIO(首席信息官)将在未来3年内投资AI。数据科学家们依托大数据,通过AI加速器建立数据模型和算法,从而赋能百行百业的行业智能化进程。

其中,数据科学得以广泛发展,自然少不了AI的助力,更少不了来自新型基础架构技术、算力发展的贡献。

数据科学的AI实现,这件利器不可少

随着云计算的发展,在云上实现AI应用也成为现实。不过也有不少重点行业企业自己部署AI服务器集群,实现自己需要的AI处理工作。也有一部分用户采用PC来做一些AI简易工作。当然也有采用数据科学工作站来完成一系列AI事务处理。

云、服务器、PC、数据科学工作站,对于数据科学的AI实现,用户到底选择哪一个更加经济、高效和易用?

要做这样一个选择之前,需要对实现现代人工智能有一个清晰的认知。

对此,戴尔科技集团专业工作站产品经理汪志军分析认为,当今大数据时代,人工智能之所以很快发展起来,其主要靠三个基础条件相互给力。即大数据、算法、强大的基础架构与算力。

不管是深度学习还是机器学习,其最终实现都需要经历一个过程。

首先是准备数据。数据收集的准备过程其实最花时间,可能要占到整个人工智能开发里面80%到90%的时间。数据采集完成还需要做清理,进行分类、标识,这需要要大量的人力物力。当然,也有一些数据科学家可以通过算法来进行快速分配。其次就是AI训练,需要采用高性能设备,如工作站、服务器来实现。最后就是模型部署。

可见,AI的实现通常要经过数据准备、模型开发和训练、以及模型部署三个阶段,整个过程对平台的算力有很高的要求。普通PC无法满足数据量庞大的AI项目对设备算力和稳定性的需求。当收集的数据越来越多元,算法强度越来越高时,只有服务器、云端以及数据科学工作站可以提供对AI的技术支持。

况且工作站对处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面的要求远高于普通商用电脑。IDC分析认为,工作站区别于普通商用电脑的关键在于工作站具备了三大特性,即:广泛的软件认证、强大的计算能力和出色的稳定性。

为此,普通PC在这个层面首先就可能被用户pass掉了。

那么,云平台和服务器又如何呢?

俗话说,没有比较就没有鉴别,没有鉴别就没有更好的选择。

相较于工作站来说,在云平台和服务器上计算价格更加高昂,特别是向云平台上传海量数据时往往也需要漫长的时间,况且云平台的带宽资源并不是免费的而是按照流量收费,其网络传输成本不菲。同时AI服务器的设备成本也比工作站昂贵。

显然,不是所有AI开发、深度学习等应用都适合部署在云或服务器上,因为设备成本、网络带宽传输成本的挑战,工作站可以带来在AI、深度学习数据处理上更好的经济成本。不过,成本也只是数据科学在AI实现上的用户选择之一。不仅成本优势,在AI项目的开发和部署阶段,数据科学工作站的优势更明显。

◆优势一,实现了灵活办公。数据科学工作站可以灵活支持用户随时随地的办公需求,不必前往服务器环境进行访问。

◆优势二,数据本地化访问。不少用户非常关心的数据本地化问题,数据科学工作站一直为本地化部署方式,强调数据本地化管理,轻松应对数据的本地访问和修改。不用担心数据在云上云下中产生传输成本。

◆优势三,设备按需配置。针对开发人员的不同需求,可以对数据科学工作站在处理器、图形加速器、内存、硬盘、显示器等硬件方面,进行按需配置,更具个性化,利于满足用户的AI不同应用需求。

◆优势四,开发软件按需安装。用户不仅可以在试验阶段,自行自由试验,而且对于容器开发包或平台软件,也可以轻松装载自由按照需求安装。

◆优势五,AI应用软件按需迭代。用户可以根据自己的AI应用需要,对数据科学工作站在算法、模型等方面进行随意迭代或修改,便于提供更加贴身的AI应用支持。

六大优势凸显,使得数据科学工作站对于用户数据科学的AI实现来说,就显得更为经济、高效和易用。

工欲善其事,必先利其器。因而,在AI助力下的数据科学,不断深入各行各业,必然少不了数据科学工作站这件好“利器”。

23年造“器”,戴尔数据科学工作站“器宇不凡”

到如今,在工作站领域的创新与发展中,戴尔已经坚守了23年多。坚持不懈,创新不止。

从1997年发布第一款工作站产品,到现在戴尔已经推出了覆盖用户多样化需求的移动工作站、机架式工作站、塔式工作站和工作站一体机。

23年造器,实属罕见,戴尔数据科学工作站到底有着怎样的“器宇不凡”呢?

一是·强算力

一方面,戴尔Precision工作站拥有广泛的产品线,以及专门针对数据科学领域的数据科学工作站,采用英特尔CPU+NVIDIA GPU芯片强大算力来支撑数据的分析。包括拥有强大计算性能和GPU显卡的7000系列高端移动工作站、支持多GPU显卡的Precision 5820塔式工作站以及超强性能与可扩展性的7000系列塔式工作站和机架工作站。

另一方面,戴尔工作站从电源到散热的设计都能更极致地优化高端GPU性能,因此拥有更强的算力。对于用户来说,配备戴尔塔式工作站,既拥有了强大GPU算力,又能享受到工作环境的静音,也不用放在机房里,使用更加灵活。

如Precision 7550和Precision 7750移动工作站可选英特尔至强处理器、NVIDIA RTX5000专业显卡,Precision 7540移动工作站采用第九代英特尔处理器、NVIDIA Quadro RTX显卡,拥有业界突出的高性能。同时,配备了全新Dell Precision Optimizer高级版的AI性能优化软件。

二是·强性能

戴尔Precision工作站针对高端GPU做了相应的散热和主板优化,采用高性能显卡支持多个同步计算和模型,使交易商和分析师能够运行速度更快的软件。

戴尔Precision数据科学工作站搭载企业级高性能专业组件和NVIDIA GPU,其硬件加速的速度比普通CPU快一个数量级,大大节省了数据科学家训练模型的时间。

戴尔Precision数据科学工作站搭载NVIDIA Quadro RTX GPU,并支持预装 NVIDIA CUDA-X AI加速数据科学软件资源合集,以及支持快速部署带容器的人工智能框架,大力加速人工智能计算。

采用多通道散热设计,散热性能和静音效果更佳,可使整个系统在繁重工作负载下更安静地工作。比如戴尔Precision 7820/7920塔式工作站采用FlexBay和多通道散热设计,对IO吞吐有着更好表现,对整体性能提升带来很好帮助。

FlexBay设计不仅对工作站性能带来好处,同时支持多个SATA/SAS驱动器或者更多的M.2或U.2 PCIe NVMe固态硬盘,因为M.2和U.2 PCIe NVMe固态硬盘具备热插拔功能,所以这样的设计可以让用户无需关闭工作站也可以拔掉SSD盘,让工作方式更为灵活。

三是·强稳定

对于任何一个数据科学的AI实现来说,稳定压倒一切。算力再强,性能再好,更需要更强的稳定支撑。

戴尔Precision工作站配备对数据科学极为重要的错误检查和纠正ECC内存,防止在软件、数据调用或是大数据并行计算时出现蓝屏或数据读取失败。

同时,戴尔自身的专利技术智能纠错内存(RMT),可以进一步防止因为硬件问题导致的内存错误。在硬件出现故障的时候,工作站主板上的一个芯片可以自动屏蔽硬件坏掉的部分,让内存继续稳定运行,减少宕机时间。

四是·强兼容

任何用户都不情愿为系统或软件的兼容性上花费时间,因而数据科学家在做AI项目时,工作站的兼容性往往是重要的考量要素。

目前,戴尔数据科学工作站拥有AI平台、操作系统、开发包以及广泛的软件认证。工作站自带的智能调优软件Dell Optimizer,可以根据用户使用习惯自动调优常用软件,提升性能,让系统运行更加流畅、稳定。强大的兼容性,这也是戴尔数据科学工作站赢得用户享受到更好AI体验的基础。

五是·强易用

算力强、性能强、稳定强、兼容强,什么都强,但是如大型机那样使用复杂的话,也必然很难得到百行百业的应用普及。

为此,通过与NVIDIA及操作系统和人工智能开发平台的厂家合作,戴尔Precision数据科学工作站在出厂前就经过硬件配置和系统预装载。采用了NVIDIA技术的戴尔Precision数据科学工作站配备NVIDIA Quadro RTX GPU 和 NVIDIA CUDA-X AI加速数据科学软件资源合集,包括如RAPIDS、TensorFlow、PyTorch和Caffe等AI开发软件,让现代计算应用从NVIDIA GPU的计算平台中受益。任何用户都可以开箱即用,随时进行数据模型的准备和AI开发。

强易用,解决了之前工作站配备一套新的AI平台费时费力的问题,为数据科学家们争取了大量可用于工作研究的宝贵时间。

当前,在新基建的大趋势下,来自5G、特高压、城际交通、新能源、大数据中心、人工智能、工业互联网多个领域的蓬勃发展,对工作站带来了新需求。不仅强调工作站的强大算力,而且还非常重视支持AI程序开发和应用的AI算力,以及高效渲染和实时仿真分析的图形图像处理能力,同对这一切运行的稳定可靠性也有着更高要求。

戴尔数据科学工作站以其强算力、强性能、强稳定、强兼容、强易用的能力,全面赋能数据科学的AI实现,助力数据科学家获得数据的真价值。帮助数据科学家从海量的数据中获得商业洞察,将数据价值应用到改善生活、社会以及整个大环境,提升数据科学家们的研究和科学探索能力。

用户最为关心的两个问题,戴尔Precision如何应对?

虽然戴尔可以为用户提供强算力、强性能、强稳定、强兼容、强易用的数据科学工作站,但是对于用户来说,有两个问题尤为关注。

一是,ECC内存基本上成了戴尔Precision工作站标配,目前来看,ECC对工作站性能影响如何?在性能和稳定性之间,戴尔Precision工作站如何实现技术权衡?

二是,工作站的处理能力与稳定性固然重要,但安全性也必不可少。特别是做数据科学研究的用户,数据早已成为了根本。戴尔Precision工作站在安全性的设计与考虑上,又是如何考虑的呢?

针对第一个问题,戴尔科技集团商用终端解决方案资深工程师黄亮分析指出,对于传统的图形工作站和视频工作站来说,更强调显示这个方面的优化。但对于数据科学工作站来说,自然对AI计算的要求会更高一些。

其一,通常来讲,越是计算密集的任务,其内存占用量会越大,内存的吞吐量也越大,一旦某个数据位出错,就会导致程序的结果错误或者崩溃的情况发生。所以,NVIDIA的高端GPU如Tesla和Quadro都支持ECC,毕竟计算密集型的应用会对ECC的要求会更高。

其二,ECC对性能会有一点影响。比如显卡开启ECC后,其容量会有一点损失,但对系统内存不会有影响。对于需要更高可靠性的用户来说,消耗一点显存容量换来更好的可靠性也是值得,况且内存、显存都会有配置冗余。

实际上,在石油、天然气、电力、工业制造等行业领域,其设计人员、研发人员需要长时间运行工作站,少则几个小时,多则7×24小时不停机,稳定性就显得尤其重要。如果工作站配置了ECC功能,那么就可以避免一些问题发生保障应用软件的可靠运行。

由此,在性能与稳定性之间,戴尔Precision科学工作站构建了强大的“平衡术”。

针对第二个问题,戴尔科技集团专业工作站产品经理汪志军分析指出,诸如影视制作、广告创意、医药研发、制造设计等领域,有着知识产权的严格要求,对安全有着共同的重视。

一方面,戴尔针对用户安全性需求高的领域,提供机架式Precision科学工作站与之匹配。

比如有部分用户,将机架式工作站部署在数据中心,借助Precision机架式工作站的远程登录卡配件,打造卓越的远程工作站体验。同时前端的研发人员、设计人员在工作站平台上只能进行研发工作,无法通过拷贝数据、拔掉硬盘去非工作站平台做研发和设计,这极大保护了相关用户的安全性。

另一方面,从产品设计上去考虑工作站的安全性。针对一部分安全性要求高的用户需要,戴尔Precision工作站支持硬盘锁、机箱锁、密码锁,以及带有开箱记录或开箱报警的设计。

此外,在全新戴尔Precision工作站里面,还设计了不同方式的安全功能,如登陆的人脸识别、开机的指纹识别,智能读卡的身份识别等,通过多种路径和方式,来保障工作站用户日常的安全性。

由此,在保护数据资产上,戴尔进一步强化了Precision工作站的安全性价值。

可见,工作站用户最为关心的这两个问题,也成为了戴尔长期的坚持与努力的方向。

面向未来,戴尔在行动

数据科学工作站毕竟只是提供了适合数据科学的AI实现平台,最终要在百行百业中实现智能化升级,离不开产学研的体系打造。

目前,戴尔科技集团目前在中国已与10所双一流大学共同设立了创客联合实验室,参与了几十所大学的产学合作协同育人项目,连续4年获得教育部最佳合作伙伴奖。

近期,戴尔科技集团与复旦大学联合更开发了全国首个人工智能、自动驾驶线下实践课。课程汇集众多技术、行业专家,聚焦AI技术,手把手教学生从实操出发,联结自动驾驶基本理论框架和流程,打造沉浸式教学体验,践行产学研深度结合,帮助高校学子连接AI、大数据等前沿科技。

面向中国的数据科学未来,戴尔科技集团凭借自身的实力与能力,正在与产业链上下游合作伙伴、用户、科研院校协同发展,共同推进AI赋能数据科学,助力改善我们的生活、社会以及整个大环境的方方面面。

       责任编辑:xj

打开APP阅读更多精彩内容

收藏

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。 侵权投诉

相关话题

评论(0)

加载更多评论
相关文章

分享到

QQ空间 QQ好友 微博
取消