Participe da Maratona Behind the Code! Prêmios e desafios incríveis te esperam, não perca! Inscreva-se aqui

Visualizar dados com Python

Resumo

Desenvolvido para todas as pessoas que usam dados para criar Jupyter Notebooks e outros artefatos, este padrão mostra o poder das bibliotecas de software livre, como Pandas, PixieDust e Folium. O Pandas introduziu estruturas e séries de dados ao Python e é uma parte fundamental do uso do Python para análise de dados. Com o PixieDust, hospedado no IBM Watson™ Studio, é possível criar rapidamente gráficos, diagramas e tabelas sem códigos complexos, de uma forma interativa e dinâmica. Além disso, os PixieApps são utilizados para integrar elementos da UI diretamente no Jupyter Notebook. Com um provedor de dados de software livre como o USGS, o PixieDust e o Watson Studio podem capacitar você a analisar e compartilhar visualizações de dados. O Folium baseia-se no poder de preparação de dados do ecossistema Python e no poder de mapeamento da biblioteca Leaflet.js. Manipule seus dados em Python e, em seguida, visualize-os em um mapa do Leaflet por meio do Folium.

Descrição

O USGS é um órgão científico do governo dos Estados Unidos. Seus cientistas estudam a paisagem dos United States, seus recursos naturais e os perigos naturais que os ameaçam, fornecendo inúmeras fontes de dados de software livre, como o site waterdata.usgs.gov.

Este padrão de código usa algumas técnicas padrão da ciência de dados e da engenharia de dados, em execução no Watson Studio, para analisar dados disponíveis publicamente sobre a enchente em Houston, no Texas, em 2017. O Watson Studio é um ambiente baseado em nuvem, interativo e colaborativo, no qual os cientistas de dados, os desenvolvedores e outros profissionais interessados em ciência de dados podem usar ferramentas (como, o RStudio, o Jupyter Notebooks e o Spark) para colaborar, compartilhar e reunir insights de seus dados.

Ao concluir este padrão, você poderá:

  • Usar o Jupyter Notebooks para carregar, visualizar e analisar dados
  • Executar o Jupyter Notebooks no Watson Studio
  • Utilizar o PixieDust como um auxiliar do IPython Notebook
  • Criar um painel usando o PixieApps
  • Encontrar, organizar e exibir dados disponíveis publicamente
  • Criar um mapa interativo com o Mapbox GL e o Folium

Fluxo

Visualizar dados com o Python

  1. Carregar o Jupyter Notebook na plataforma Watson Studio.
  2. Os dados do USGS sobre a enchente de Houston de 2017 são carregados no Notebook.
  3. O Notebook é usado para limpar os dados e, em seguida, exibi-los.
  4. É criado um painel do PixieApp com o qual é possível interagir.
  5. O Mapbox e o Folium são usados para as visualizações de mapa.

Instruções

Encontre as etapas detalhadas desse padrão no LEIA-ME. As etapas mostram como:

  1. Inscrever-se no Watson Studio.
  2. Criar o Notebook.
  3. Executar o Notebook.
  4. Analisar os resultados.
  5. Salvar e compartilhar.