摘要
本 Code Pattern 是使用 IBM Cloud Pak for Data、Data Virtualization、Watson OpenScale 和 Cognos Analyics 探索电信呼叫中断预测的系列 Code Pattern 的一部分。
级别 | 主题 | 类型 |
---|---|---|
201 | 将多个分布式数据源作为一体进行查询:用于数据分析的 Data virtualization | 教程 |
201 | 使用 IBM Cloud Pak for Data 中的 Watson OpenScale 监控机器学习模型 | Pattern |
101 | 在 IBM Cloud Pak for Data 上的 Cognos Analytics 中构建仪表板 | 教程 |
301 | 使用 IBM Cloud Pak for Data 预测、管理和监控手机信号塔的呼叫中断 | Pattern |
现如今,企业越来越确信,AI 将在未来几年内成为其行业发展的推动力。为了成功地将 AI 注入您的产品或解决方案,就需要在企业内广泛应用 AI 并利用 AI 实现您的预期结果,而这个过程中存在诸多挑战。这些挑战可能包括:
建立信任 – 由于 AI 具有“黑匣子”的性质,因此组织和企业通常对 AI 持怀疑态度,从而导致许多很有前景的模型无法投入生产。
算法偏差 – AI 系统的另一个固有问题是,它们的好坏取决于用于训练它们的数据。如果输入数据中充满种族、性别、社区或民族偏见,那么模型的准确性最终将逐渐消失。
使决策具有可解释性 – 模型如何证明其决策背后的原因?通过全面跟踪任何 AI 驱动的应用程序的输入和输出,可以完整解释 AI 的结果,这一点至关重要。
概览
在本 Code Pattern 中,您将了解如何使用 IBM Cloud Pak for Data 中的 Watson OpenScale 在应用程序中监控 AI 模型。我们将使用一个电信呼叫中断预测模型示例。用户完成本 Code Pattern 后,将会掌握如何:
- 使用开源技术在 Watson Machine Learning 中存储自定义模型
- 部署模型并将模型部署连接到 IBM Cloud Pak for Data 和 IBM Cloud 上的 Watson OpenScale
- 使用 Python Notebook,通过 IBM Cloud Pak for Data 和 IBM Cloud 上的 Watson OpenScale 来设置模型公平性和模型质量监视器
- 在 IBM Cloud Pak for Data 上创建项目和设置 Python Notebook
流程
- 数据已存储在 Cloud Pak for Data 内部数据库中。
- 合并后的数据将重新存储到 IBM Cloud Pak for Data 的内部数据库中,并且分配给当前工作项目。
- 使用 Jupyter Python Notebook 创建机器学习模型以预测呼叫中断(每次预测一个手机信号塔)。
- 在 Watson Machine Learnin 中训练和/或存储的模型,此模型也连接到 Watson OpenScale。
- 为每个手机信号塔的模型配置公平性、质量和可解释性监视器,并在 IBM Cloud Pak for Data 或其他外部云(多云架构)中显示这些监视器。
操作说明
可以在 README 中找到本 Code Pattern 的详细步骤。 这些步骤将展示如何:
- 创建 Watson Machine Learning 实例。
- 在 IBM Cloud Pak for Data 中创建一个新项目。
- 将数据集上载到 IBM Cloud Pak for Data。
- 将 Notebook 导入到 IBM Cloud Pak for Data。
- 按照 Notebook 中的步骤进行操作。
- 在 Watson OpenScale 中显示部署。
- 查看 Watson OpenScale 的其他用例。
本文翻译自:Monitor your machine learning models using Watson OpenScale in IBM Cloud Pak for Data(2019-10-15)