行业资讯
随着微软不断增加其Azure大数据产品组合,用户发现越发难以跟上这些更新。下面是组织采取大数据行动的必须知道的Azure术语的细目。
大数据正上增工,不仅是规模,知名度也在上升。每天企业都有比前一天更多的数据需要处理,无论是通过互联网事务,还是社交媒体。但许多企业都需要一种服务,可以在短时间内缩减信息量——这正是云访问的路径。
随着企业重新把注意力放在构建智能云平台上,微软Azure大数据服务越来越具吸引力。 Azure平台提供的能力包括:信息管理、存储、机器学习、分析和认知服务。另外,企业还可以在 Azure市场中从大数据和高级分析合作伙伴中访问应用。
但是在开始之前,使用这些术语来了解微软Azure大数据服务:
Azure Data Lake Analytics:数据湖分析,是微软公有云中用于大数据的一个查询服务。该服务允许客户分析数据数据,并获得洞察,自动扩展资源。根据微软据说,组织可以与其现有的工具一起使用Data Lake Analytics,用于识别、管理、安全和仓库工作。Azure Active Directory 与该服务集成提供了更深入的用户许可管理。Azure Data Lake Analytics有权访问Azure SQL Data Warehouse、Power BI和 Data Factory,它是Cortana Analytics Suite的一部分。该服务使用U-SQL——微软从SQL和 C#中分离出来的查询语言。
Azure Data Lake Store:Data Lake Store给大数据提供了基于Apache Hadoop的 超大规模存储。该系统可以以其原有的形式存储结构化和非结构化的数据。该 服务设计减少延迟,归置关于帐户和文件规模的未修复的限制,据微软说。该服务与其它的微软Azure大数据服务集成,包括Azure Data Lake Analytics和Azure HDInsight。
Azure HDInsight:HDInsight是一个Hadoop即服务产品,用于管理Apache Hadoop、Spark和 R集群。它可以按需扩展,存储巨大量数据,用户可以通过Excel来分析和可视化数据。HDInsight还包括了其它功能,如 Apache HBase、 Apache Storm、Apache Spark和R server for Hadoop
Azure Stream Analytics:Stream Analytics服务允许用户执行实时分析。主要用于物联网,它可以执行数据流,并从中获得洞察,同时低延迟扩展。它与Azure Event Hubs集成来比较多个数以流。该服务可发送定制化的警示,并在控制面板中实时显示数据。
Azure Data Factory:Data Factory是一项编排服务,它用于协调本地与云之间的数据行为,从而为消费做准备。用户可以监视和自动化数据管道,而且它还可以创建、调度、管理和编排数据流。它还用于连接其它的微软Azure大数据服务,如HDInsight、Stream Analytics和机器学习。
Azure Data Catalog:Data Catalog是一个管理服务,用于简化数据的发现。该工具允许用户注册和发现数据源,以及分享见解。用户可以将元数据组织到目录中,并控制谁可以访问哪些数据集。
Azure Power BI Embedded:Power BI Embedded服务让用户能够创建交互式报告来可视化数据。组织可以将这些视觉内容嵌入应用程序中,而无需通过REST API和SDK更改应用程序的设计。数据可在个来源中可视化,包括Azure SQL Database 和Azure SQL Data Warehouse 。它还提供了现成的数据可视化,以及创建自定义视觉效果的能力。
全部0条评论
快来发表一下你的评论吧 !