借助内置 Notebook 的 Watson Machine Learning 进行数据分析、建模以及部署  

在 IBM Cloud Pak for Data 上使用 Watson Machine Learning 和 Jupyter Notebook 预测客户流失率

Description

此 Pattern 已纳入 IBM Cloud Pak for Data 快速入门学习路径

在本 Code Pattern 中,我们使用 IBM Cloud Pak for Data 通过整个数据科学管道来解决业务问题,并使用电信客户流失率数据集来预测客户流失率。IBM Cloud Pak for Data 是基于云的交互协作环境。它可帮助数据科学家、开发者和其他对数据科学感兴趣的人使用工具开展协作,共享和收集数据中潜藏的洞察,以及构建和部署机器学习与深度学习模型。

概览

客户流失,即客户终止与企业的合作关系,是决定企业收入的最基本因素之一。您需要知道哪些客户是忠诚的,哪些客户有流失的风险,还需要从客户的角度了解影响这些决策的因素。本 Code Pattern 将演示如何构建机器学习模型,并用它来预测客户是否有流失的风险。这是一个完整的数据科学项目,稍后您可以使用您模型发现的结果进行规范分析,或执行针对性营销。

学完本 Code Pattern 之后,您将掌握如何:

  • 使用 Jupyter Notebooks 加载、可视化和分析数据
  • IBM Cloud Pak for Data 中运行 Notebook
  • 在 IBM Cloud Pak for Data 上使用 Spark Mlib 来构建、测试和部署机器学习模型
  • 使用 IBM Cloud Pak for Data 将选定机器学习模型部署到生产中
  • 创建一个前端应用程序来连接客户端,并开始使用已部署的模型

  1. 用户将 Jupyter notebook 加载到 IBM Cloud Pak for Data 平台中。
  2. 通过 Cloud Pak for Data 快速入门学习路径完成数据虚拟化教程之后,电信客户流失率数据集已直接从 github 存储库或者作为虚拟化数据加载到 Jupyter Notebook 中。
  3. 对数据进行预处理,构建机器学习模型并保存到 IBM Cloud Pak for Data 上的 Watson Machine Learning 中。
  4. 将选定机器学习模型部署到 IBM Cloud Pak for Data 平台上的生产环境中,并获取评分端点。
  5. 使用模型通过前端应用程序进行信用预测。

Instructions

准备好实践本 Code Pattern 了吗?参阅 README,获取有关如何开始运行和使用此应用程序的完整详细信息。

本 Code Pattern 展示了如何使用 IBM Cloud Pak for Data 通过整个数据科学管道来解决业务问题,并使用电信客户流失率数据集来预测客户流失率。本 Code Pattern 已纳入 IBM Cloud Pak for Data 快速入门学习路径。 要继续学习本系列课程并了解 IBM Cloud Pak for Data 的更多信息,可查看下一个 Code Pattern 利用 Watson OpenScale 监视模型

相关博客

相关链接

英文原文

Data analysis, model building, and deploying with Watson Machine Learning with notebook(2019-10-04)

数据预处理详解

本文重点介绍了数据预处理(这是数据科学的第一步)。它介绍了整个预处理流程,并探讨了用于完成此流程中每个步骤的不同方法。

Privacy Preference Center

Close your account?

Your account will be closed and all data will be permanently deleted and cannot be recovered. Are you sure?