使用机器学习来预测治疗心脏病的药物  

使用机器学习分析匿名患者数据,预测治疗心脏病的最佳药物

Description

免责声明:本 Notebook 仅用于演示和说明目的,并不构成经过法规审查的服务产品。它并非旨在充当医疗应用。对于此应用输出的准确性不作任何表示,此应用也不附有任何保证。

在本 Code Pattern 中,我们使用匿名患者数据来预测治疗心脏病的最佳药物。本 Notebook 介绍了有关获取数据、构建模型、部署模型和对模型评分的命令。

概览

在应用程序中使用机器学习可以产生令人震撼的效果,但是从模型训练阶段过渡到生产应用程序需要进行大量工作。虽然 Apache Spark MLlib、scikit-learn 和 Xgboost 等框架可以帮助减少模型构建工作量,但 IBM Watson Machine Learning 这一解决方案却可以在几分钟内将这些模型投入生产。通过利用 Watson Machine Learning Web 服务来部署模型,您可以轻松地使用功能强大的 REST API 开始构建应用程序。

在本 Code Pattern 中,我们使用机器学习分类算法来解决一家生产心脏病药物的虚构生物医学公司所提出的要求。该公司已经收集了一组患者的数据,这些患者都患有同样的疾病。在治疗过程中,每位患者服用五种药物中的一种之后有所好转。根据治疗记录,该公司希望为患者预测最佳药物。本 Code Pattern 提供了详尽步骤来演示如何使用该数据和 Spark MLlib 包来训练预测最佳药物的模型。

接下来,该公司将训练好的模型发布到 IBM Cloud 上的 Watson Machine Learning 存储库中,然后作为一项 Web 服务进行部署。新患者的记录通过经认证的请求发送到评分终端,模型则在响应中返回一条药物建议。

完成本 Code Pattern 后,您将掌握如何:

  • 准备数据、创建 Apache Spark 机器学习管道以及训练模型
  • 在 Watson Machine Learning 存储库中发布样本模型
  • 部署一个模型以便在线评分(作为 Web 服务)
  • 使用样本评分记录和评分终端对模型进行评分

  1. 使用 Jupyter Notebook、Python 3.5 和 Spark 在 Watson Studio 中创建一个项目。
  2. 使用 Db2 Warehouse on Cloud 加载和读取数据。
  3. 使用 PySpark 创建管道,训练模型,并使用 Watson Machine Learning 服务来存储模型。

Instructions

可以在 README 文件中找到本 Pattern 的详细步骤。这些步骤将展示如何:
  1. 克隆该存储库。
  2. 在 IBM Cloud 中创建 Watson 服务。
  3. 保存 Watson Machine Learning 服务凭证。
  4. 创建 Db2 Warehouse on Cloud 服务并加载数据。
  5. 在 IBM Watson Studio 中创建 Notebook。
  6. 在 IBM Watson Studio 中运行 Notebook。

相关博客

相关链接

英文原文

本 Code Pattern 翻译自:Predict heart medicine using machine learning(2018-12-13)