¡Participa de la Maratón Behind the Code, la competencia de programación más desafiante! Inscríbete aqui

Analice conjuntos de datos médicos abiertos para obtener conocimientos

Resumen

La cantidad de problemas de salud que existen hoy en día en el mundo son una mina de oro en datos para los científicos de datos que quieren extraer significado e interpretar los datos de los diferentes problemas. Este patrón se sumerge en un conjunto de datos que explora las muertes por sobredosis de opiáceos. Continúe para saber cómo explorar estos datos en un cuaderno de Watson Studio, visualice algunos descubrimientos iniciales con Pixie Dust y después utilice scikit-learn para entrenar modelos de servidores y para evaluar cuál tiene las predicciones más precisas de prescripciones de opiáceos.

Descripción

Las sobredosis de opiáceos se están convirtiendo en un problema cada vez más abrumador para los Estados Unidos. Aunque es posible que los científicos no puedan resolver este problema por sí solos, pueden echar un vistazo a los datos para ver qué es exactamente lo que esta ocurriendo y que elementos pueden dar lugar a determinados resultados.

Este Code Patterns le guiará a través de la utilización de scikit-learn y Python (en IBM Watson Studio) para predecir las prescripciones de opiáceos basándose en un conjunto de datos de Kaggle que incluyen valores como muertes por sobredosis de opiáceos, tipo de médico y la prescripción. En este patrón usted explorará los datos en un cuaderno de Watson Studio, y utilizará Pixie Dust para visualizar algunos descubrimientos iniciales de diferentes maneras. Después de que haya completado la exploración inicial, utilizará scikit-learn para entrenar modelos de servidores y para averiguar cuál tiene las predicciones más precisas de prescripciones de opiáceos. Al utilizar la biblioteca scikit-learn usted será capaz de acceder a varios clasificadores de aprendizaje automático que podrá implementar con un número relativamente mínimo de líneas de código.

Este Code Patterns fue creado por científicos de datos y por los amantes de los datos que están interesados en los problemas de justicia social, problemas de salud o por los que son novatos en DSX y en aprendizaje automático. Lo guía a usted a través de la exploración de datos, de la limpieza de datos, de los modelos de entrenamiento y de su evaluación.

Cuando haya completado este patrón, debería saber lo siguiente:

  • Utilizar Watson Studio
  • Explorar varios marcos de datos
  • Visualizar exploraciones
  • Limpiar los datos con Python y pandas
  • Construir varios modelos de aprendizaje automático para predecir una variable objetivo
  • Evaluar el desempeño de los modelos

Flujo

Diagrama de las etapas para crear la aplicación

  1. Inicie sesión en el servicio IBM Watson Studio.
  2. Suba los datos como un activo de datos de Watson Studio.
  3. Inicie un cuaderno en Watson Studio e introduzca el activo de datos que ha creado anteriormente.
  4. Explore los datos con pandas.
  5. Cree visualizaciones de datos con Pixie Dust.
  6. Entrene modelos de aprendizaje automático con scikit-learn.
  7. Evalúe el desempeño de sus predicciones.

Instrucciones

Encuentre los datos detallados para este patrón en README. Esos pasos le mostrarán cómo se hace lo siguiente:

  1. Registrarse para IBM Watson Studio.
  2. Crear el cuaderno.
  3. Ejecutar el cuaderno.
  4. Guardar y compartir.
  5. Limpiar los datos con Python.
  6. Ejecutar varios modelos para predecir las prescripciones de opiáceos a través de scikit-learn.
  7. Evaluar los modelos.

Aviso

El contenido aquí presentado fue traducido de la página IBM Developer US. Puede revisar el contenido original en este link.