NoSQL革命已经进入了关系世界。您可能正在使用关系数据库,但仍必须查询和理解隐藏在文本列、JSON或 XML文档中的半结构化数据。
隐藏的数据复杂性
让我们看一下我们用于从Calendly(在线会议预订软件)导入数据的下表:
表面上看起来很简单,只有五列。但是,如果您查看内部,您会注意到其中两列实际上是(JSON) 文档存储。
如果您查看文档,您会发现数据模型的大部分字段和复杂性都隐藏在这两个文本列中。因此,要了解数据结构,仅查看列列表是不够的,还必须了解此数据中JSON 文档的结构。
记录JSON
我有个好消息- Dataedo可以帮助您。您可以自动提取和记录JSON 文档的结构,并将它们链接到表列。
首先,您需要将JSON 文档添加到目录中。在存储库导航器中单击数据库,选择添加对象和添加/导入结构。
然后选择“粘贴文档”选项,以便能够自动解析JSON。
现在,粘贴列中的任何JSON 文档。它应该是有代表性的,即拥有所有(或大部分)的领域。如果它是一个正确的文档,那么您会注意到Dataedo 将格式检测为JSON。单击“导入”以添加文档的结构。
Dataedo将打开一个窗口,其中包含解析的文档的结构。您可以在此处对其进行修改(将其添加到存储库后也可用)- 添加、重命名或删除字段或更改类型。为结构提供一个名称- 最好包含格式,例如event_type.json。
现在,您可以将新结构保存到存储库中。
这将创建名为“具有新添加结构的结构”的新文件夹。您可以像浏览任何其他对象一样浏览其字段。您还可以使用描述、标题或自定义字段来记录字段。
链接文档和列
好的,您有一个JSON文档的文档。现在,您需要指定表列包含特定文档。为此,您可以使用手动关系(主要用于定义外键/连接)。右键单击该列,然后选择添加关系。现在,在PK表字段中,从列表中选择相关文档,在PK列字段中选择PK(或任何其他)列并保存关系。
您会在“参考文献”列中注意到引用的文档。您还可以在“关系”选项卡上找到这些链接。
最终结果
您的工作已完成。您记录了存储在数据库中的JSON 文档,并解释了哪些字段包含这些文档。此方法允许您将一个文档链接到多个列。
下面是HTML 文档中的视图。您会注意到,很容易看到列包含文档并导航到其定义。
也很容易找出特定文档在数据库中的使用位置。
审核编辑:汤梓红
全部0条评论
快来发表一下你的评论吧 !