使用机器学习模型对流数据评分

本 Code Pattern 已纳入学习路径:IBM Streams 入门

级别 主题 类型
100 IBM Streams 简介 文章
101 无需编写代码即可创建您的首个 IBM Streams 应用程序 教程
201 从 Apache Kafka 提取数据 Code Pattern
301 使用 Python API 构建流应用程序 Code Pattern
401 使用机器学习模型对流数据评分 Code Pattern

摘要

在本 Code Pattern 中,我们将以流式方式传输在线购物数据,并使用这些数据跟踪由每个客户添加到购物车的产品。我们将使用 scikit-learn 来构建 k 均值聚类模型,以便根据客户购物车中的物品对客户进行分组。可以使用集群分配来预测要推荐的其他产品。

概览

使用 IBM Cloud Pak® for Data 上的 IBM Streams 来构建应用程序。IBM Streams 提供了一个内置的 IDE(称为 Streams Flows),此 IDE 可用于直观地创建流应用程序。IBM Cloud Pak for Data 平台还提供了其他支持,例如,与多个数据源集成、内置分析、Jupyter Notebook 和机器学习。

要构建和部署机器学习模型,我们将使用 IBM Watson® Studio 中的一个 Jupyter Notebook 以及一个 Watson Machine Learning 实例。在我们的示例中,这两者都在 IBM Cloud Pak for Data 上运行。

通过 Streams Flows 编辑器,我们将使用以下操作程序来创建流应用程序:

  • 一个 Source 操作程序,用于生成样本点击流数据
  • 一个 Filter 操作程序,其仅保留“添加到购物车”事件
  • 一个 Code 操作程序,其使用 Python 代码对购物车中的物品进行排列并将其放入用于评分的输入数组中
  • 一个 WML Deployment 操作程序,用于将客户分配到集群
  • 一个 Debug 操作程序,用于演示结果

流程

流程

  1. 用户构建并部署机器学习模型。
  2. 用户创建并运行 IBM Streams 应用程序。
  3. Streams Flow UI 显示了流式传输、过滤和评分操作的实际效果。

操作说明

准备好行动了吗?README 说明了用于执行以下操作的步骤:

  1. 验证能否访问 Cloud Pak for Data 上的 IBM Streams 实例。
  2. 在 Cloud Pak for Data 中创建一个新项目。
  3. 构建并存储模型。
  4. 将部署空间与项目相关联。
  5. 部署模型。
  6. 创建并运行 Streams Flow 应用程序。

恭喜!学完本 Code Pattern 后,即已完成了 IBM Streams 入门系列。除了介绍 IBM Streams 外,我们还展示了如何:

  • 无需编写代码即可创建您的首个 IBM Streams 应用程序
  • 构建 Apache Kafka 流应用程序
  • 使用 Python API 构建流应用程序
  • 使用机器学习模型对流数据评分

现在,您应该已经基本了解了 IBM Streams 及其部分功能。若想要了解更多信息,可观看 IBM Streams 流式分析简介系列视频。

本文翻译自:Score streaming data with a machine learning model(2020-11-23)