使用 IBM Cloud Pak for Data 中的 Watson OpenScale 监控机器学习模型

摘要

本 Code Pattern 是使用 IBM Cloud Pak for Data、Data Virtualization、Watson OpenScale 和 Cognos Analyics 探索电信呼叫中断预测的系列 Code Pattern 的一部分。

现如今,企业越来越确信,AI 将在未来几年内成为其行业发展的推动力。为了成功地将 AI 注入您的产品或解决方案,就需要在企业内广泛应用 AI 并利用 AI 实现您的预期结果,而这个过程中存在诸多挑战。这些挑战可能包括:

  • 建立信任 – 由于 AI 具有“黑匣子”的性质,因此组织和企业通常对 AI 持怀疑态度,从而导致许多很有前景的模型无法投入生产。

  • 算法偏差 – AI 系统的另一个固有问题是,它们的好坏取决于用于训练它们的数据。如果输入数据中充满种族、性别、社区或民族偏见,那么模型的准确性最终将逐渐消失。

  • 使决策具有可解释性 – 模型如何证明其决策背后的原因?通过全面跟踪任何 AI 驱动的应用程序的输入和输出,可以完整解释 AI 的结果,这一点至关重要。

概览

在本 Code Pattern 中,您将了解如何使用 IBM Cloud Pak for Data 中的 Watson OpenScale 在应用程序中监控 AI 模型。我们将使用一个电信呼叫中断预测模型示例。用户完成本 Code Pattern 后,将会掌握如何:

  • 使用开源技术在 Watson Machine Learning 中存储自定义模型
  • 部署模型并将模型部署连接到 IBM Cloud Pak for Data 和 IBM Cloud 上的 Watson OpenScale
  • 使用 Python Notebook,通过 IBM Cloud Pak for Data 和 IBM Cloud 上的 Watson OpenScale 来设置模型公平性和模型质量监视器
  • 在 IBM Cloud Pak for Data 上创建项目和设置 Python Notebook

流程

流程

  1. 数据已存储在 Cloud Pak for Data 内部数据库中。
  2. 合并后的数据将重新存储到 IBM Cloud Pak for Data 的内部数据库中,并且分配给当前工作项目。
  3. 使用 Jupyter Python Notebook 创建机器学习模型以预测呼叫中断(每次预测一个手机信号塔)。
  4. 在 Watson Machine Learnin 中训练和/或存储的模型,此模型也连接到 Watson OpenScale。
  5. 为每个手机信号塔的模型配置公平性、质量和可解释性监视器,并在 IBM Cloud Pak for Data 或其他外部云(多云架构)中显示这些监视器。

操作说明

可以在 README 中找到本 Code Pattern 的详细步骤。 这些步骤将展示如何:

  1. 创建 Watson Machine Learning 实例。
  2. 在 IBM Cloud Pak for Data 中创建一个新项目。
  3. 将数据集上载到 IBM Cloud Pak for Data。
  4. 将 Notebook 导入到 IBM Cloud Pak for Data。
  5. 按照 Notebook 中的步骤进行操作。
  6. 在 Watson OpenScale 中显示部署。
  7. 查看 Watson OpenScale 的其他用例。

本文翻译自:Monitor your machine learning models using Watson OpenScale in IBM Cloud Pak for Data(2019-10-15)