本 Code Pattern 纳入 IBM Cloud Pak for Data 快速入门学习路径。
级别 | 主题 | 类型 |
---|---|---|
100 | IBM Cloud Pak for Data 简介 | 文章 |
101 | 利用 Data Virtualization 实现 Db2 Warehouse 数据虚拟化 | 教程 |
201 | 利用 Data Refinery 实现数据可视化 | 教程 |
202 | 使用 Watson Knowledge Catalog 查找、准备和理解数据 | 教程 |
301A | 借助内置 Notebook 的 Watson Machine Learning 进行数据分析、建模以及部署 | Pattern |
301B | 使用 AutoAI 自动构建模型 | 教程 |
301C | 使用 IBM SPSS Modeler 快捷构建预测机器学习模型 | 教程 |
401 | 利用 Watson OpenScale 监视模型 | Pattern |
摘要
在本 Code Pattern 中,我们使用 IBM Cloud Pak for Data 通过整个数据科学管道来解决业务问题,并使用电信客户流失率数据集来预测客户流失率。IBM Cloud Pak for Data 是基于云的交互协作环境。它可帮助数据科学家、开发者和其他对数据科学感兴趣的人使用工具开展协作,共享和收集数据中潜藏的洞察,以及构建和部署机器学习与深度学习模型。
概览
客户流失,即客户终止与企业的合作关系,是决定企业收入的最基本因素之一。您需要知道哪些客户是忠诚的,哪些客户有流失的风险,还需要从客户的角度了解影响这些决策的因素。本 Code Pattern 将演示如何构建机器学习模型,并用它来预测客户是否有流失的风险。这是一个完整的数据科学项目,稍后您可以使用您模型发现的结果进行规范分析,或执行针对性营销。
学完本 Code Pattern 之后,您将掌握如何:
- 使用 Jupyter Notebooks 加载、可视化和分析数据
- 在 IBM Cloud Pak for Data 中运行 Notebook
- 在 IBM Cloud Pak for Data 上使用 Spark Mlib 来构建、测试和部署机器学习模型。
- 使用 IBM Cloud Pak for Data 将选定机器学习模型部署到生产中 创建一个前端应用程序来连接客户端,并开始使用已部署的模型。
流程
- 用户将 Jupyter notebook 加载到 IBM Cloud Pak for Data 平台中。
- 通过 Cloud Pak for Data 快速入门学习路径完成数据虚拟化教程之后,电信客户流失率数据集已直接从 github 存储库或者作为虚拟化数据加载到 Jupyter Notebook 中。
- 对数据进行预处理,构建机器学习模型并保存到 IBM Cloud Pak for Data 上的 Watson Machine Learning 中。
- 将选定机器学习模型部署到 IBM Cloud Pak for Data 平台上的生产环境中,并获取评分端点。
- 使用模型通过前端应用程序进行信用预测。
操作说明
准备好实践本 Code Pattern 了吗?参阅 README,获取有关如何开始运行和使用此应用程序的完整详细信息。
结束语
本 Code Pattern 展示了如何使用 IBM Cloud Pak for Data 通过整个数据科学管道来解决业务问题,并使用电信客户流失率数据集来预测客户流失率。本 Code Pattern 已纳入 IBM Cloud Pak for Data 快速入门学习路径。 要继续学习本系列课程并了解 IBM Cloud Pak for Data 的更多信息,可查看下一个教程使用 AutoAI 自动构建模型。
本文翻译自:Data analysis, model building, and deploying with Watson Machine Learning with notebook(2019-10-04)