大型主机的智能运维如何应对

描述

专家介绍:方琳

毕业即加入IBM,具有16年运维相关工作经验,从开放到主机,见证着运维多年来的变迁。深刻理解运维能力对企业尤其金融行业稳定发展的决定性作用。擅长主机监控、事件管理、智能分析等运维解决的能力和方案设计。工作之余喜欢旅行和尝试新鲜事物,坚信努力探索,工作和生活总会有不期而遇的惊喜。

无论你是否关注新技术,都一定能感受到我们的生活方式发生了翻天覆地的变化。拿起电脑、手机就可以购物、就医、开会,足不出户,世界已经尽在掌握。新的消费模式给消费者带来了无与伦比的体验感,但也一定会遇到过出错或变慢的糟糕情形。这就是转型的痛点之一:新的IT环境极为复杂,交易的路径也尤为繁琐,给运维带来了难度的提升。我们要怎样应对这种挑战?

2016年,Gartner提出智能运维(AiOps)的理念,即将人工智能(AI)应用于IT运维。借助大数据分析和机器学习能力从“噪音”(海量的运维数据)中筛选“信号”(异常数据),以识别与系统性能和可用性问题相关的重大事件,并快速诊断根本原因,甚至可以根据经验预判未来,有更充足的时间来轻松应对。简而言之,即是让机器通过自我学习帮助我们维护良好的IT环境。

当“智能运维”遇上“大型主机”

“大型机”也需要和“会”智能运维吗?众所周知,大型机支撑着企业最为重要的应用,从某种程度上说,对主机的运维水平,决定着关键业务的成败。

在固有印象中,大型机是功能强大但孤立的节点,与现代化、开源、融合关系不大,这种想法真的是“out”了。大型机的云化、数字化转型由来已久,且从未停止它的脚步。新一代的大型机已经全面实现与开放世界、云化平台的互联互通,不仅为实现企业全面的智能运维做好准备,更为助力智能运维做了创新型增强,此处请容我卖个关子,杀手锏毕竟总是最后才会亮相。

让我们重新思考之前提到的消费者的糟糕体验,大型机的智能运维如何应对?

首先要做到“透明”,我们要洞悉交易的全视图,以便快速发现并定位瓶颈。就如我们的行车导航,能够看到全线路中“红色拥堵”发生在哪里。面对应用交易链路难以跟踪和定位,应用性能的问题隔离的挑战,大型机采用应用程序性能管理(APM)来轻松应对。Instana on z/OS是主机上不错的选择,它可以帮助我们跟踪主机交易的全过程,当问题发生时,拓扑形式的交易路径清晰的展现在我们面前,刺眼的“红色”提醒就是元凶。当然,主机从来不是独立的存在,instana当然也可以连通交易的另一端——开放的世界,从交易到运维,业务都是一个不可分割的整体。

问题已经发现,但根本原因是什么呢?车流过大还是发生了交通事故?对IT来讲这要比洞悉交通问题更复杂,毕竟大型机所产生的运维数据是海量,从中快速的发现根本原因并不是一件容易的事情。但不要紧张,有了人工智能的助力,大型机已经做了充分的准备。所有主机产生的性能数据、警报、日志等都可以交给机器来学习,拥有了智能的机器,不但具有人类的学习能力,还有着人类所不能比拟的速度。“它”通过对长期的历史数据的“学习”来形成认知基础,当新的运维数据产生时,“它”可以与已学习到的知识体系做比较,当行为模式偏离时发出警报,此种动态和智能的报警能力更有利于识别真正的问题和异常,从根本上提高警报的质量,甚至在异常情况发生之前预判,避免因业务的中断带来的不可估量的损失。当然“它”还很勤劳,会不断的用新的数据来丰富自己,学习新的行为模式,以求分析和告警都更为精确,我们称之为迭代式学习过程。

有了这两个得力助手,如此复杂的问题竟然可以轻松应对。当然这个过程是整个运维团队和机器共同协作才能完成的。跨领域协作解决方案(ChatOps)能助力我们实现孤立的团队成员之间以及机器之间的跨界合作,以无缝、透明的方式将人员、流程、工具和自动化连接起来,运维团队将实现基于统一视角的全协作工作模式。

“杀手锏” :深藏功与名

主机强大的智能运维能力是不是到这里就结束了?新一代大型机z16“说”怎么会,我们还有杀手锏。新一代IBM Z的 Telum处理器专为加速AI而诞生。该处理器采用7纳米技术,配置8核16线程,频率5.2GHz。每个处理器核包含独占的32MB二级缓存,256MB虚存和高达2GB的四级缓存。同时Telum还配有片内集成(on-chip)的AI推理加速器,该处理器可以大幅提升机器模型学习和分析的速度。有了如此高科技Telum处理器的加持,结合与数据的近距离的优势,数据再海量,线索再复杂,在z16面前都将无处遁形。

双向奔赴,理想的运维生活

高科技总是感觉高高在上,那今天让梦想照进现实。某行通过主机机器学习的能力对历史数据进行分析,并将主机所产生的实时交易数据与历史趋势进行比较,当发现异常时发送报警信息,使问题在发生之前得到及时处理。运维人员就可以像医生看病一样,快速找到需要重点关注的病人,并看到病人各项检查的信息,从而做出快速而精准的诊断。同时利用趋势分析,还实现了对容量的预测分析,坐标今日,畅想未来。

新一代主机和智能运维的双向奔赴,大型机的运维在等待和你一起进入一个新时代。

原文标题:"z"就是"AI",一次说清楚

文章出处:【微信公众号:IBM中国】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分