机器学习算法到底学到了什么?

电子说

1.3w人已加入

描述

当代社会的生产和生活在许多方面都离不开庞大复杂的软硬件系统,包括互联网、高性能计算、电信、金融、电力网络、物联网、医疗网络和设备、航空航天、军事装备和网络等。

这些系统的用户需要良好的用户体验。因此,这些复杂系统的部署、运行和维护需要专业的运行维护人员来应对各种突发事件,确保系统的安全可靠运行。因为各种突发事件都会产生大量的数据,从本质上讲,智能运维可以看作是大数据分析的具体场景。

智能操作和维护的范围是机器学习、软件工程、行业知识、操作和维护场景知识在四者结合的交叉领域,智能运维的顺利发展离不开四者的密切配合。

得益于大数据和人工智能,今天的运营维护模式开始走向智能化阶段,越来越多的企业开始重视智能化运营维护。公司和组织采用集中监控平台收集系统的各种运行状态和执行逻辑信息,如网络流量、服务日志等等等来实现综合感知。随着系统规模的增长,运维数据也呈爆炸式增长。每天产生数千亿的监测数据和日志,给运行维护带来各种困难和挑战,推动了智能运行维护技术的不断发展。

相较于手动运维,自动化运维极大地提升了运维的效率,DevOps提升了研发和运维的配合效率。然而当整个互联网系统的数据规模开始爆炸性增长和服务类型的复杂多样,基于人为指定规则的专家系统遇到了诸多瓶颈,其中很重要的一条是:对于长期从事某行业运行维护工作的专家来说,手工总结重复、可追溯的现象,形成规则,完成自动运行维护是非常必要的。然而,这种基于人工规则的方法并不能解决大规模的运行维护问题。

与依赖人工生成规则的自动操作和维护不同,智能操作和维护强调机器学习算法从海量运维数据中自动学习(包括事件本身和运维人员人工处理日志),完善和总结规则。也就是说,智能运维在自动运维的基础上增加了一个基于机器学习的大脑,它命令监控系统采集大脑决策所需的数据,进行分析、决策,并命令自动脚本执行大脑决策,从而达到系统运行维护的总体目标。

高德纳报告预测,全球aiops的部署率将从2017年的10%提高到2020年的50%。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分