概要
在商业智能 (BI) 及分析领域即将迎来的后续突破中,我们将见证使用机器学习和人工智能改善数据访问和数据质量,揭示以前未被发现的深入见解,建议分析,提供预测分析和行动建议。更重要的是,在自然语言 (NL) 界面的帮助下,不具备数据科学知识或查询语言知识的业务用户将能够更容易地探索信息、获得见解并更好地做出数据驱动型决策。
BI 和分析供应商正在至少四个领域开发“智能”功能,涵盖数据准备、数据分析和发现、NL 查询和预测。这些智能功能有助于推动实现超越自助式分析的发展,帮助向业务用户进一步普及数据分析。本报告探讨 Tableau Software 已经推出并正在着力开发的智能功能,以及这些功能将如何使 Tableau 客户受益。报告结尾就筹划实施智能分析功能的企业提供了建议。
关于 TABLEAU 的新兴智能功能
➤第一代商业智能 (BI) 系统的复杂性和 IT 技术的要求使企业一度心灰意冷,而大约十年前,企业开始采用自助式产品进行数据发现和数据可视化。这种自助式分析方法解放了分析师和精通数据的业务用户, 使他们无需等待 IT 部门的帮助就可以分析数据。
➤在过去的五年中,自助式分析需求不断增长,并已经扩展到数据准备和基础预测分析领域。而这五年间的另一个趋势是机器学习 (ML) 及人工智能 (AI) 方面的重大突破。云计算推动了 ML、神经网络、机器视觉和自然语言 (NL) 理解技术的进步。上述进步促进了面向消费者“智能”个人助理产品的创新,例如 Alexa、Google Assistant 和 Siri,而这些产品则又激起了人们对 ML 和 AI 驱动型商业软件智能功能的兴趣。
➤现在,BI 和分析市场涌现出各种智能功能。本报告重点讲述的是 Tableau 中现有的和即将加入的智能功能。Tableau 用户目前可利用的智能功能有:最佳匹配可视化建议、自动聚类分析和预测,以及个性化意图驱动型建议。
➤2018 年 4 月,Tableau 通过 Tableau Prep 添加了自助式数据准备功能,其中包括数据清理和数据联接等智能功能。下一步将要添加的是基于 NL 的智能查询功能,而 Tableau 便计划在今年晚些时候的 Beta 版本中发布。
细分市场
Tableau 是自助式 BI 和分析的先驱,而且从软件收入和客户数量来看,过去的几年里,Tableau 一直是市场领导者。
然而,分析市场正在不断演变,朝着 Constellation Research 所谓的智能分析时代迈进 (参见图 1)。
新兴的智能功能利用 ML 辅助人们完成各项任务,包括数据准备、数据发现和用户查询意图(基于历史数据访问模式)的理解。当自然语言理解功能与 AI 驱动 NL 查询相关联时,ML 同样也会促进新兴自动预测功能的发展。自助式服务使得 BI 和分析获得了更广泛的用户基础,而智能功能则有望开辟一个新的普及时代,让所有用户都能够更容易地进行数据发现、分析、预测甚至基础数据准备。
Constellation 认为,这些 ML 和 AI 驱动的进步并不是对自助式分析的扩展,而是计算机辅助型分析新时代即将开启的早期迹象。智能功能利用计算机处理能力为人类的诠释技巧锦上添花,因为计算机分析可用来应对自动化重复任务和处理复杂计算。Tableau 将此举称为其进军智能领域的“增强分析”策略。这一战略需要实现的两个目标为,一方面让数据驱动型分析扩展至更广泛的受众,另一方面则帮助现有的 Tableau 用户更加迅速轻松地分析数据,从而获得更加深入的见解。
图 1:自助式分析的时代正让位于 ML 和 AI 辅助型智能分析的时代
目标市场
Tableau 平台的目标用户是“任何一位”数据工作者。逾 74000 个付费客户企业使用它的产品,包括 Tableau Desktop、Tableau Server 和 Tableau Online 托管服务。免费的 Tableau Public 站点上有逾 30 万活跃用户,他们每周发布约 7000 份分析。
Tableau 现有和新型的智能功能都与其产品和平台紧密结合,而非独立的产品或新品。鉴于公司力度更大的分析策略,Constellation 预计后续的智能功能将一如既往地与产品和平台紧密结合,而非推出独立的产品。
实用功能
Tableau 对智能功能最初的投资可以追溯到 2007 年,但是于 2016 年随着智能分析趋势的到来,开始对智能功能加大投资力度,如图 1 所示。自 2016 年起,Tableau 不断而稳定地发布了一系列智能功能。下文依照时间顺序逐一介绍这些智能功能。
2007 年
智能显示。2007 年 Tableau 引入“智能显示”功能,起初是一系列可供使用的可视化选项。根据所选择的分析数据,“智能显示”缩小了可用可视化类型的选择范围,并还能突出显示建议的方法。推荐可视化加快了分析的速度,同时为给定类型的数据或分析提供最适当的可视化建议。
2016 年
聚类分析。这是一种基于数据中的 ML 点相关性、模式、趋势和影响因素的自动发现方法,为业务用户呈现具有深入分析价值的特定数据维度或数据组合。2016 年,Tableau 将发现导向型聚类分析引入 Tableau Desktop,帮助用户识别数据中的隐藏关系。在 2018 年春季发布的版本中,Tableau 添加了群集自拟合功能,可以刷新和自动重新计算已保存的群集数据,包括 Tableau Server 上的数据提取。
预测。初期的智能预测功能只是简单的趋势预测,凭借简单算法推断历史趋势的未来走向,但这仅是一个没有将季节性等因素考虑在内的生硬工具。2016 年,Tableau 引入自动预测功能,并能够生成指数平滑模型。该功能可自动从八种不同的时间预测模型系列中进行选择,自动挑选出合适的超参数。
2017 年
智能数据表、数据联接和数据源建议。意图驱动型建议功能运用 ML 技术,并基于数据连接模式和用户行为,根据个人、群组、工作角色、权限和其他变量对数据表、数据联接和数据源提出建议。2017 年,Tableau 引入智能数据表和数据联接建议功能,挖掘 Tableau Server 上现有的数据连接模式。同年 年底,Tableau 添加了更为复杂的数据源建议功能,该功能能够基于用户特定模式推断用户的意图。
2018 年
Tableau Prep。一些 BI 和分析供应商引入自助式数据准备功能,并内置于他们的 BI 和分析产品中。2018 年 4 月,Tableau 推出 Tableau Prep 功能。这是一种新型可视化数据准备功能,脱胎于此前代号为 Project Maestro,前后进行了两年的研发项目。
Tableau Prep 为数据准备提供了专用的功能集和独立的用户界面,然而工具集仍与 Tableau 工作流的其余部分集成在一起。例如,Tableau Prep 用户可以利用任何连接到 Tableau 的数据源,一旦在 Prep 中完成组织和清理,数据就可以在 Tableau Desktop 或基于浏览器的用户界面中供预览和检索。
在可辅助人们完成数据准备任务智能功能的出现和催化下,自助式数据准备产品也开始分化。Tableau Prep 中包含的智能功能有:
数据配置。Tableau Prep 的数据配置窗格是用户界面呈现的三个视图之一(请参见图 2) 数据配置参数显示了所记录内容的数目以及每个数据字段中值的分配。此外,还显示了空值或缺失值的数量。
自动 DateParse。利用数据配置统计数据、格式化和清理功能,显示给定字段的流行数据格式,并指出异常,以便修复、验证或者删除。Tableau Prep 的自动 DateParse 功能通常使用格式化的方法,自动将所有选定的日期规范化成为常用日期格式。
自动拆分。这个功能通过找到一个通用的分隔符,自动分割值并将值分开排列,例如 Air Austria、Air Canada 和 Aer Lingus。主题专家可以检查并浏览这些自动变化,以确保恰当的应用这些变化。
图 2:Tableau Prep 界面提供的数据流(顶部)、数据配置(中间)以及数据窗格(底部)视图
联接建议。ML 技术通常用于识别添加数据或联接数据的时机。Tableau Prep 利用 Tableau 中已有的基本功能,根据主键、外键、字段名和数据类型的相似性,识别并建议潜在的联接。
模糊匹配。Tableau Prep 的模糊匹配功能可以自动对值等进行分组并应用一致的名称,从而将其结合在一起,例如“Southwest Airlines、South West、Southwest 和 Southwest Air” 就可以利用模糊匹配分为一组。
自然语言查询。Tableau 自 2016 年起就开始研究 NL 查询,但是这一进程实现加速却得益于 2017 年 8 月对 ClearGraph 公司的收购。ClearGraph 是一家利用语义理解、统计数据和数据使用记录来改进自然语言查询的初创企业。语义理解有助于阐明会话式问题的含义,以及术语的常见同义词。Tableau 一直致力于利用自己的平台整合 ClearGraph 的技术,并计划在 2018 年下半年的 Beta 版中推出自己的 NL 查询功能。
Tableau 即将推出的 NL 查询功让使用户能够选择数据源,输入会话式自然语言问题,从而生成新的可视化。一旦您开始输入,引擎就开始提供解释和建议查询。随着用户继续输入,这些建议不断完善,就像体验互联网搜索引擎一样。NL 问题常常是模棱两可的,所以引擎会提供许多选项。用户可以用 “点赞”和“不满”的反馈,帮助随时间推移提升准确性。
智能分析的后续步骤
2018 年 6 月 13 日,Tableau 宣布收购了起源于麻省理工学院的 AI 初创公司 Empirical Systems(下文 简称“Empirical”)。
Empirical 创办于 2016 年,开发了一款分析引擎,旨在通过人工接口和 API 将受过培训的统计学家要进行的分析自动化,并使该分析可查询。该公司的方法类似于自动发现和分析工具所使用的方法,这些工具可以识别数据中的影响因素、关键驱动因素和异常因素。
Tableau 将基于 Empirical 的数据引擎推出什么新功能,什么时候推出新功能,现在推测这些还为时过早。Constellation 预计,此次收购将推动新功能的开发,例如帮助分析师发现变量之间的关系,从而找出在活动中形成模式或峰值的潜在因素,并推断数据中的缺失值。
分析和观察
优势与不足
Tableau 开端强势,拥有跨越新兴智能功能领域的诸多投资,但它在各个领域的优势尚待均衡。Constellation 从以下四个方面分析了 Tableau 的优势与不足:
智能数据准备
优势
Tableau Prep 在配置方面塑造了坚实的开端,客户有望看到除自动 DateParse 和自动拆分之外的更多自动清理和格式化选项。
Tableau Prep 利用模糊聚类分析,为联接数据最佳方法提出建议打下了良好的基 础。Tableau 表示正在研究更多此种类型的功能。
Tableau Prep 体验与 Tableau 工作流的其余部分相结合,更加清晰明了,降低了数据连接的挑战,也减少了应用程序之间的切换。
不足
用于数据格式化和数据清理的数据分析等基本功能现已成为标准配备。Tableau 将必须增加更多的格式化和清理功能来跟上市场的步伐。
最佳数据准备供应商(以及 Tableau 的合作伙伴)Paxata 和 Trifacta 可提供更广泛的基 于 ML 的智能清理、格式化和联接功能。
智能发现与分析
优势
Tableau 是提供最佳可视化建议的先驱。
该公司利用聚类分析和群集自拟合功能,在自动发现方面塑造了坚实的开端。
意图驱动型建议功能处于最前沿;Tableau 智能数据表和联接建议,以及建议数据等功能,加快了分析并推进了深度探索。
不足
基于不同数据类型的最佳匹配可视化建议正在成为基本配置功能的一部分。先进工具同样可以评估实际数据。例如,如果有负值,建议可能会不同。
智能发现和自动分析的市场选择正在激增。Tableau 必须在当前聚类分析和推荐功能之外,提供其他附加功能以保持竞争力。
智能预测
优势
Tableau 自动预测功能不仅仅是简单的趋势分析,还将季节性等因素的影响考虑在内。 该功能无需数据科学技能,但是手动算法选择功能和过滤器可有效避免黑盒预测。
Tableau 支持嵌入式 R 和 Python 代码,并与高级分析合作伙伴 MathWorks 进行第三方集成,以支持更复杂的预测需求。
不足
预测功能只是一项预测技术。为了跟上市场需求的步伐,Tableau 将必须推出更多的自动化选项。
自然语言查询
优势
Tableau 的 NL 查询研究扩展到了语义理解和语用学查询,能够保留初始问题的上下 文,然后更加深入地迭代探索主题。在撰写本文时,这些功能还未发布和测试。
不足
Microsoft 自 2013 年起发布的 Power BI 已经具备这些功能,另外 IBM Watson Analytics、AnswerRocket 和 ThoughtSpot 等公司也自 2014 年引入这些功能,相比之下,Tableau 的 NL 查询上市较晚。
Tableau 智能功能的竞争性定位
正如关于 NL 查询的“优势和不足”分析中提到的,Tableau 并不是第一家提供多种智能功能的公司, 但是它自 2016 年起加快了投资步伐。
Constellation 认为 Tableau 在提供预期智能功能方面已经拥有良好的开端。随着今年 Tableau Prep 的引入和即将发布的 NL 查询功能,智能功能系列正在持续壮大。
Constellation 认为,针对基于可用智能功能的公司级别标准分析平台,大多数企业还尚未选择使用。 虽然 ThoughtSpot 和 AnswerRocket 等初创企业是这一领域的创新者,但它们最初趋向于更集中、更具实验性质的应用。更重要的是,他们各自的客户基数只有几十个。相比之下,Tableau 通过为成千上万的客户提供内置功能,正推动着智能分析时代的前进。
对于 Tableau 而言,存在的风险来自于大型供应商收购创新型初创企业,并将其智能功能推广为主流产品。Constellation 正在跟进大型供应商的智能分析举措,其中包括 IBM、Microsoft、Oracle、Salesforce 和 SAP;独立企业如 Qlik 和 Tibco Spotfire;以及一些创新型初创企业。自 2018 年年初起,Tableau 就开始紧跟这股潮流。客户和潜在客户应该紧跟智能分析领域的最新研发项目和 Tableau 路线图。
主要差异化优势
简单易用且先进的数据探索和数据可视化是 Tableau 的标志。现在,大多数竞争对手均可提供数据可视化的附加模块和服务,但许多都是作为大型企业软件交易或云服务合同的一部分,并且免费提供的未经区分的工具集。与采用量不温不火的商品化工具不同,Tableau 产品拥有庞大而忠实的粉丝群体。
Tableau 预见到竞争将会越来越多激烈,其中包括来自大型云供应商的竞争。与许多独立企业一 样,Tableau 也利用混合云策略和多云策略来应对这些威胁。该公司已经加强了大规模部署的系统管理和数据治理功能。下一个挑战将是增加自动化和集装化选项,确保能够在本地、私有云和公共云选项之间一致部署 Tableau Server。
该公司利用 Tableau Prep 显著提高了其自助式功能,而且在不提价的情况下,将此功能在整合到其最高级订阅选项中(请参见“价格”部分)。这一升级将帮助 Tableau 富有能力、精通数据的用户获取更多功能,包括若干具有突出优势的智能数据准备功能,同时无需增加成本。
建议
考虑支持数据准备、数据发现和分析、NL 查询和自动预测功能等领域的新兴智能功能,从而使数据分析面向更广泛的受众,并为现有用户加速和深化分析。
Tableau 自 2016 年起就开始提供智能数据发现、数据分析和自动预测等功能。该公司随后于 2017 年推出了意图驱动型建议功能,并于 2018 年 4 月推出了智能数据准备功能。后续将会推出 NL 查询功能, 预计将作为 Beta 版于 2018 年下半年发布。这些成就使 Tableau 成为 Constellation ShortListTM 追求智能分析能力的领先供应商之一,Tableau 的客户应充分利用这些功能。
请遵循关于如何开辟下一个智能分析时代的建议,充分利用这些新兴功能。
从最佳做法着手
市场可能正在从自助式时代转向智能时代,但只要企业需要考虑、测试和部署这些新技术,就不可避免地会用到以下三种基于 ML 和 AI 的最佳做法:
建立一个涉猎广泛的跨职能团队不要光着眼于培养众所周知的商业/ IT 合作关系,要确保双方团队都有全能代表,包括关键业务相关者以及 IT、软件开发和数据、分析部和数据科学专家。
选对项目无论选择哪种智能功能或供应商(注意事项如下),您都应该选择正确的项目作为试点测试案例。选择不太大、不太耗时、不太冒险但又不至于太小、太不重要而被忽略的项目。从简单、快速胜利,可以看到明显回报的项目开始入手。积累一定的成功经验之后,开始做一些难度稍微增加的项目。
采用敏捷方式敏捷系统性开发运维 (DevOps) 的特点是开发周期快速迭代、多功能团队代替业务部和 IT 部门进行反复评审,以及在尽可能多的地方应用自动化和监控系统。
解决信任和透明度的问题
Constellation 坚信,信任和透明度是企业在采用 ML 和 AI 技术时将面临的两个最大问题。根据需要改变管理和培训,从而增强基于 ML 和 AI 的建议和建议行动的可信度。
如果能够了解如何以及为什么做出这些决定和建议,人们就会更容易接受计算机的辅助并接受此流程中的变化。这就是透明度发挥作用的地方。智能系统应该是可解释的,而非不可思议的。
为了简化复杂的技术并支持自助式功能,包括 Tableau 在内的供应商正在将自动化和幕后决策应用于内部复杂过程,例如算法的选择。“黑盒”(不透明的)预测系统的危险在于,它可能不会做出最符合组织或客户利益的决策或建议。总的来说,Tableau 的理念是用算法来辅助人类。值得一提的是,Tableau 的自动预测和自动聚类功能可以转换为手动控制。
智能预测应该在分析专家的监督下进行,以确保它们不会导致可能产生代价高昂的行为。还有一种方法是让分析师和精通数据的业务用户体验自动化预测功能,然后与数据科学家分享他们的发现,数据科学家可以据此增强分析并将整理好的模型投入生产。
Constellation 相信,基于 ML 和 AI 的系统和应用程序应尽可能的透明和易于解释。真正基于 ML 和 AI 的智能系统将是那些可以解释、可理解和可信任的智能系统。
全部0条评论
快来发表一下你的评论吧 !