砥砺奋进谱新篇,且看旧貌换新颜。欢迎访问新的 IBM Developer 中文网站! 了解详情

通过多个数据源获得洞察

摘要

在此 Code Pattern 中,我们将通过使用 Watson Studio 集成 IBM Db2 On Cloud、CSV 文件和 Db2 Warehouse 等多个数据源的数据,获得相关洞察。以数据说话通常涉及整合多个数据源的数据。在执行分析时,能够组合多个数据源的数据至关重要。利用此 Code Pattern,我们将使用一些数据源,比如 Db2 On Cloud、CSV 文件和 Db2 Warehouse。借助 Watson Studio 的强大功能,该技术可应用于其他数据源,如 MySQL 数据库、IBM Db2 Big SQL、Oracle 数据库、PostgreSQL、Microsoft SQL Server 等等 – 而不论数据集大小如何。

描述

在此 Code Pattern 中,我们将使用以下用例演示此方法:一家手表制造公司在三个不同的分公司地点(曼彻斯特、格拉斯哥和马德里)生产五种类型的手表。该手表公司使用三种不同的销售方式(电话销售、商店销售和在线销售)。每个分公司的销售数据都存储在不同的数据源(Db2 on Cloud、Db2 Warehouse 和 CSV 文件)中。我们将整合所有这三种数据源中的数据,并将其放在单个数据源(Db2 Warehouse)中。然后,这些集成数据将用于获取洞察,并在嵌入式仪表板上直观呈现出来。这将有助于我们解释哪个产品最畅销,哪个分公司的业绩最佳。

学完本 Code Pattern 之后,您将掌握如何:

  • 连接多个数据源并从中获取数据。
  • 集成多个数据源的数据。
  • 将集成数据发送到 Db2 Warehouse。
  • 在 Watson Embedded Dashboard 中获得洞察并实现可视化

流程

流程

  1. 从本地文件(csv 文件)中提取数据。
  2. 从 Db2 on Cloud 中提取数据。
  3. 在 Watson Studio 中集成数据。
  4. 将数据发送到 Db2 Warehouse。
  5. 使用嵌入式仪表板实现可视化并获得洞察。

操作说明

可在 README 文件中获取详细的操作说明。这些步骤将展示如何:

  1. 克隆存储库。
  2. 使用 IBM Cloud 创建 Watson 服务。
  3. 创建 Notebook。
  4. 从本地系统添加数据
  5. 添加 Db2 连接。
  6. 添加 Db2 Warehouse 连接。
  7. 使用凭据和 Db2 Warehouse 表名更新 Notebook。
  8. 运行该 Notebook。
  9. 使用嵌入式仪表板分析技术实现可视化并获得洞察。

本文翻译自:Generate insights from multiple data sources(2019-02-19)