使用关系数据库中的半结构化数据

描述

NoSQL革命已经进入了关系世界。您可能正在使用关系数据库,但仍必须查询和理解隐藏在文本列、JSON或 XML文档中的半结构化数据。

隐藏的数据复杂性

让我们看一下我们用于从Calendly(在线会议预订软件)导入数据的下表:

数据库

表面上看起来很简单,只有五列。但是,如果您查看内部,您会注意到其中两列实际上是(JSON) 文档存储。

数据库

如果您查看文档,您会发现数据模型的大部分字段和复杂性都隐藏在这两个文本列中。因此,要了解数据结构,仅查看列列表是不够的,还必须了解此数据中JSON 文档的结构。

数据库

记录JSON

我有个好消息- Dataedo可以帮助您。您可以自动提取和记录JSON 文档的结构,并将它们链接到表列。

首先,您需要将JSON 文档添加到目录中。在存储库导航器中单击数据库,选择添加对象和添加/导入结构。

数据库

然后选择“粘贴文档”选项,以便能够自动解析JSON。

数据库

现在,粘贴列中的任何JSON 文档。它应该是有代表性的,即拥有所有(或大部分)的领域。如果它是一个正确的文档,那么您会注意到Dataedo 将格式检测为JSON。单击“导入”以添加文档的结构。

数据库

Dataedo将打开一个窗口,其中包含解析的文档的结构。您可以在此处对其进行修改(将其添加到存储库后也可用)- 添加、重命名或删除字段或更改类型。为结构提供一个名称- 最好包含格式,例如event_type.json。

现在,您可以将新结构保存到存储库中。

数据库

这将创建名为“具有新添加结构的结构”的新文件夹。您可以像浏览任何其他对象一样浏览其字段。您还可以使用描述、标题或自定义字段来记录字段。

数据库

链接文档和列

好的,您有一个JSON文档的文档。现在,您需要指定表列包含特定文档。为此,您可以使用手动关系(主要用于定义外键/连接)。右键单击该列,然后选择添加关系。现在,在PK表字段中,从列表中选择相关文档,在PK列字段中选择PK(或任何其他)列并保存关系。

数据库

您会在“参考文献”列中注意到引用的文档。您还可以在“关系”选项卡上找到这些链接。

数据库

最终结果

您的工作已完成。您记录了存储在数据库中的JSON 文档,并解释了哪些字段包含这些文档。此方法允许您将一个文档链接到多个列。

下面是HTML 文档中的视图。您会注意到,很容易看到列包含文档并导航到其定义。

数据库

也很容易找出特定文档在数据库中的使用位置。

数据库

审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分