Participe da Maratona Behind the Code! Prêmios e desafios incríveis te esperam, não perca! Inscreva-se aqui

Analise conjuntos de dados médicos abertos para obter insights

Apresentação

Com tantos problemas de saúde no mundo atualmente, existe uma mina de ouro de dados para os cientistas de dados que desejam extrair o significado desses dados e interpretá-los a partir de diferentes problemas. Este padrão mergulha em um conjunto de dados que examina as mortes por overdose de opioides. Acompanhe-nos para ver como explorar esses dados em um bloco de notas do Watson Studio, visualizar algumas conclusões iniciais utilizando Pixie Dust e utilizar scikit-learn para treinar vários modelos e avaliar quais têm as previsões mais exatas de prescrições de opioides.

Descrição

As overdoses de opioide vêm se tornando um problema cada vez maior para os Estados Unidos. Embora os cientistas de dados não consigam resolver esse problema sozinhos, eles podem consultar dados e ver exatamente o que está acontecendo e quais elementos podem levar a certos resultados.

Este padrão de código demonstra o uso de scikit-learn e Python (no IBM Watson Studio) para antever prescritores de opioide com base em um conjunto de dados Kaggle, que inclui valores como mortes por overdose de opioides, tipo de prescritor e a própria prescrição. Com este padrão, você vai explorar os dados em um bloco de notas do Watson Studio e utilizar o Pixie Dust para visualizar algumas conclusões iniciais de várias maneiras. Após concluir a exploração inicial, utilize o scikit-learn para treinar vários modelos e descobrir quais têm as previsões mais exatas de prescrições de opioides. Usando a biblioteca scikit-learn, você poderá acessar facilmente inúmeros classificadores de aprendizado de máquina, que podem ser implementados com linhas de código relativamente mínimas.

Este padrão de código foi criado para cientistas e amantes de dados com interesse em questões de justiça social, problemas de saúde e para aqueles que são novos no DSX e no aprendizado de máquina. Ele orienta você durante a exploração de dados, a limpeza de dados, o treinamento de modelos e sua avaliação.

Após ter concluído este padrão, você deverá saber:

  • Utilizar o Watson Studio
  • Explorar múltiplos quadros de dados
  • Visualizar explorações
  • Limpar os dados utilizando Python e pandas
  • Desenvolver vários modelos de aprendizado de máquina para prever uma variável alvo
  • Avaliar o desempenho dos modelos

Fluxo

Fluxograma das etapas para criação do app

  1. Efetue login no serviço IBM Watson Studio.
  2. Faça upload dos dados como um recurso de dados no Watson Studio.
  3. Inicie o bloco de notas no Watson Studio e insira o recurso de dados criado anteriormente.
  4. Explore os dados com pandas.
  5. Crie visualizações de dados com o Pixie Dust.
  6. Treine os modelos de aprendizado de máquina com scikit-learn.
  7. Avalie o desempenho da predição.

Instruções

Encontre os passos detalhados para este padrão no README. Essas etapas mostrarão como:

  1. Inscreva-se no IBM Watson Studio.
  2. Crie o notebook.
  3. Execute o notebook.
  4. Salvar e compartilhar.
  5. Limpe os dados usando o Python.
  6. Execute vários modelos para prever prescritores opióides usando o scikit-learn.
  7. Avalie os modelos.

Aviso

O conteúdo aqui presente foi traduzido da página IBM Developer US. Caso haja qualquer divergência de texto e/ou versões, consulte o conteúdo original.