本 Code Pattern 已纳入学习路径:IBM Streams 入门。
级别 | 主题 | 类型 |
---|---|---|
100 | IBM Streams 简介 | 文章 |
101 | 无需编写代码即可创建您的首个 IBM Streams 应用程序 | 教程 |
201 | 从 Apache Kafka 提取数据 | Code Pattern |
301 | 使用 Python API 构建流应用程序 | Code Pattern |
401 | 使用机器学习模型对流数据评分 | Code Pattern |
摘要
在本 Code Pattern 中,我们将以流式方式传输在线购物数据,并使用这些数据跟踪由每个客户添加到购物车的产品。我们将使用 scikit-learn 来构建 k 均值聚类模型,以便根据客户购物车中的物品对客户进行分组。可以使用集群分配来预测要推荐的其他产品。
概览
使用 IBM Cloud Pak® for Data 上的 IBM Streams 来构建应用程序。IBM Streams 提供了一个内置的 IDE(称为 Streams Flows),此 IDE 可用于直观地创建流应用程序。IBM Cloud Pak for Data 平台还提供了其他支持,例如,与多个数据源集成、内置分析、Jupyter Notebook 和机器学习。
要构建和部署机器学习模型,我们将使用 IBM Watson® Studio 中的一个 Jupyter Notebook 以及一个 Watson Machine Learning 实例。在我们的示例中,这两者都在 IBM Cloud Pak for Data 上运行。
通过 Streams Flows 编辑器,我们将使用以下操作程序来创建流应用程序:
- 一个 Source 操作程序,用于生成样本点击流数据
- 一个 Filter 操作程序,其仅保留“添加到购物车”事件
- 一个 Code 操作程序,其使用 Python 代码对购物车中的物品进行排列并将其放入用于评分的输入数组中
- 一个 WML Deployment 操作程序,用于将客户分配到集群
- 一个 Debug 操作程序,用于演示结果
流程
- 用户构建并部署机器学习模型。
- 用户创建并运行 IBM Streams 应用程序。
- Streams Flow UI 显示了流式传输、过滤和评分操作的实际效果。
操作说明
准备好行动了吗?README 说明了用于执行以下操作的步骤:
- 验证能否访问 Cloud Pak for Data 上的 IBM Streams 实例。
- 在 Cloud Pak for Data 中创建一个新项目。
- 构建并存储模型。
- 将部署空间与项目相关联。
- 部署模型。
- 创建并运行 Streams Flow 应用程序。
恭喜!学完本 Code Pattern 后,即已完成了 IBM Streams 入门系列。除了介绍 IBM Streams 外,我们还展示了如何:
- 无需编写代码即可创建您的首个 IBM Streams 应用程序
- 构建 Apache Kafka 流应用程序
- 使用 Python API 构建流应用程序
- 使用机器学习模型对流数据评分
现在,您应该已经基本了解了 IBM Streams 及其部分功能。若想要了解更多信息,可观看 IBM Streams 流式分析简介系列视频。
本文翻译自:Score streaming data with a machine learning model(2020-11-23)