互联网企业的主要数据来源是散落在各个业务服务器上的半结构化日志,比如系统日志、程序日志、访问日志、审计日志等。目前国内互联网企业单日日志数据增量达到TB级很常见。互联网企业间的竞争非常激烈,实时统计分析日志数据并将结果指导决策能够提高企业的竞争力。因此最原始的日志数据记录具有丰富和巨大的价值。
目前很多开源的系统,如Flume、Kalka、Storm、HBase等可以对日志数据进行处理,但是这些系统相互独立,均庞大复杂,需要专门的数据处理人员根据需求编程来使用,而企业的业务和运维部门一般没有专业从事大数据实时处理的人员,因此设计大数据实时处理平台,为用户提供不需要编程就能方便使用的大规模日志数据实时多维统计分析功能,是各个互联网企业的迫切需求,飞流应运而生。
统一的大规模日志数据实时多维统计分析平台需要接入多种来源的日志数据,每种日志记录了各种不同维度的运行数据,用户需要的是灵活的、方便的、多维度的统计分析。因此,飞流平台的设计目标主要是实现大规模日志数据的多源采集和聚合、实时多维度统计分析、用户可以在线通过配置代替大数据编程实现统计分析任务的热提交、热更新和热删除、统计分析结果通过WebUI迸行展示。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !