自 Tableau 2019.3 发布以来,数据发现和信任一直是 Tableau Catalog (Tableau Data Management 的组件)的核心原则。在每一个版本中,我们都会添加帮助用户找到和使用可信任数据的功能。
Tableau Catalog 的独特之处在于,用户可以在 Tableau 中搜索数据,并立即进入分析流程——不需要在工具和帐户之间来回切换。在 2021.1 版本中,我们专注于提高搜索的相关性,以便人们能够找到自己需要的数据并更快地开展分析。由于数据发现是 Tableau Catalog 体验的重要组成部分,因此我们希望您在 Tableau Server 或 Online 中查找数据库和表时能获得最具相关性的搜索结果。
我们发现客户都喜欢数据质量警告这项功能,所以我们还根据它添加了一个新功能!
从 Tableau 2021.1 开始,您可以对这两类事件设置监视:提取数据源刷新失败和流程运行失败。当刷新失败时,将自动生成一个质量警告,出现在对应的资产和下游内容项(如工作簿和仪表板)中。
更快地找到正确的表和数据库
搜索数据并非易事。当您知道表或数据库的确切名称时,它可以简化连接过程。但是,如果有数十或数百个相似名称的表时,那该怎么办?用户如何能知道哪一个才是正确的表?
Tableau Catalog 可让用户通过资产名称和说明(跨数据库、文件和表)进行搜索,用户也可通过列名称和列说明搜索表。通过新的改进,如果搜索词与资产名称的匹配程度越高,该结果的排名也会更高。匹配的列仍然会显示在搜索结果中,但其排名将低于匹配的表名。通过这种方式,用户只需搜索一些关键字,就可以找到正确的表格。
Tableau Catalog 还提供了信任指标,如认证状态和数据质量警告,以帮助他人找到最相关的结果。认证资产的排名高于名称相近的非认证资产;具有数据质量警告的资产的排名将较低。这意味着作为数据管理员,您可以确信用户能够正在找到他们应该用于分析的数据。
自动化生成数据质量警告
与数据打过交道的人都知道,数据刷新可能会失败。这可能有各种各样的原因,完全防止失败是不可能的。通过数据质量警告,了解数据集问题的用户可以通过在数据库、表、已发布的数据源或流程上设置警告来传达问题。
在 Tableau 2021.1 前,这些警告必须手动或通过 REST API 进行设置。而现在可以通过可视化的方式自动设置失败的数据提取或流程报错提醒。如果您在非工作时间运行流程,那么您可以直接获得系统自动发送的数据状态,而无需数据所有者或管理人员进行手动操作。通过监控数据质量警告,每位用户都可以更有信心地使用可信任的数据。
让我们先看看已发布的数据源。您可以在数据源上设置提取刷新监视,以便在提取刷新失败时,数据源和下游内容项上将自动出现警告。如果下一次刷新成功,它将清除警告。这些自动警告是在数据源已有的任何手动数据质量警告之外设置的。如果禁用了监视,警告也可以被清除。 在下面的示例中,在已发布的数据源 Seattle Crime 上设置了提取刷新监视,该数据源每周刷新一次。如需进行设置,只需导航至设置菜单,然后勾选“质量警告”和“提取刷新监控”选项。
如果提取刷新失败(例如数据库不可访问),则警告将自动出现在数据源上。与其他类型的数据质量警告类似,任何使用使用此数据源的仪表板或工作簿的人都可以看到它。通过这种自动化操作,人们可以轻松地看到他们需要分析的数据是否是他们所预期的最新状态。
对于使用 Prep Conductor 的组织,您还可以利用 Prep Conductor 故障监控。就像数据提取一样,可以对数据准备流程进行监视,以便在流程失败时通知使用下游内容的人员。这些警告会在流程上自动创建,并且在下游中随处可见。
原文标题:Tableau Catalog 新功能:改进的搜索功能和自动生成数据质量警告
文章出处:【微信公众号:Tableau社区】欢迎添加关注!文章转载请注明出处。
责任编辑:haq
全部0条评论
快来发表一下你的评论吧 !