开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

使用 Python 实现数据可视化

摘要

该 Pattern 为使用数据创建 Jupyter Notebooks 和其他工件的所有人而构建,展示了开源库(如 Pandas、PixieDust 和 Folium)的强大功能。Pandas 将数据帧和系列引入 Python,是使用 Python 进行数据分析的基本部分。通过 IBM Watson™ Studio 上托管的 PixieDust,您可以采用动态交互方式快速创建图表、图形和表格,而无需使用复杂的代码。此外,PixieApps 可用于将 UI 元素直接嵌入到 Jupyter Notebook 中。有了像 USGS 这样的开源数据提供者,您就可以使用 PixieDust 和 Watson Studio 来分析数据和共享数据可视化效果。Folium 则是在 Python 生态系统的数据整理优势和 Leaflet.js 库的映射优势之上构建而成。在 Python 中处理您的数据,然后通过 Folium 在 Leaflet 地图中实现可视化。

概览

USGS 是美国政府的科学机构。该机构的科学家对美国的景观、自然资源以及带来威胁的自然灾害进行了研究,提供了大量的开源数据来源,包括 waterdata.usgs.gov 站点。

此 Code Pattern 使用 Watson Studio 上运行的数据科学和数据工程的一些标准技术,分析 2017 年德克萨斯州休斯顿市所遭遇洪灾情况的公开可用数据。Watson Studio 是一个基于云的交互式协作环境,数据科学家、开发者和其他对数据科学感兴趣的人都可以在此使用工具(如 RStudio、Jupyter Notebook 和 Spark)开展协作、分享内容和收集数据中的洞察。

完成本 Pattern 后,您将掌握如何:

流程

使用 Python 实现数据可视化

  1. 将 Jupyter Notebook 加载到 Watson Studio 平台中。
  2. 将 USGS 关于 2017 年休斯顿市洪水的数据加载到 Notebook 中。
  3. Notebook 用于清理数据,然后显示数据。
  4. 创建可与之交互的 PixieApp 仪表板。
  5. Mapbox 和 Folium 用于实现地图可视化。

操作说明

README 中可找到本 Pattern 的详细步骤。这些步骤将展示如何:

  1. 注册使用 Watson Studio。
  2. 创建 Notebook。
  3. 运行该 Notebook。
  4. 分析结果。
  5. 保存并共享。

本文翻译自:Visualize data with Python(2019-06-07)