开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

分析数据模式以找出欺诈性保险索赔

摘要

在本开发者 Code Pattern 中,我们将分析保险索赔数据,并确定用户是否提出了欺诈性索赔。为此,我们使用 IBM Db2® Graph 来分析数据模式。该查询工具从数据库中提取索赔,并使用可视化库对索赔进行分析。保险公司的分析师可以通过在与患者身份、就诊情况、多次索赔等相关的数据中查找模式,直观地分析图表,并确定是否存在可疑索赔。

概览

随着数据量的增长,相关数据形成了庞大的网络,分析这些数据已成为一个难题。为了克服这个难题,图形数据库技术被迅速采用,因为这项技术基于关系而构建,并且表示数据的方式更为直观,便于读取和获得洞察。有许多图形数据库可以很好地处理只包含图形的用例,但企业需要的是分析系统,除了执行图形分析之外,还需要执行数据转换、聚合和其他操作。尽管图形数据库在某些类型的分析中性能优异,但并不适用于需要对大量数据进行聚合的工作负载。图形数据库不是事务处理的理想选择,并且没有良好的可扩展性。现有的大多数图形数据库都是独立使用,无法轻松地与这些其他分析系统集成。

在此 Code Pattern 中,我们将了解 IBM Db2 Graph,该工具可在 Db2 上启用 IBM Db2 Graph 分析,并允许您对同一数据副本执行 IBM Db2 Graph 分析和 SQL(用于事务处理、转换和其他分析用例),无需复制数据,也无需更改底层数据库结构。

IBM Db2 Graph 将使用 Db2 中已定义的现有关系来创建底层数据的虚拟图形视图。另外,通过定义 Db2 中定义的表和视图如何映射到图形中的节点和边,您可以创建自己的图形模型。然后,IBM Db2 Graph 公开图形模型,以便您可以执行 Gremlin 查询。IBM Db2 Graph 在查询执行时仅从 Db2 中获取必要的数据,因此对 Db2 中数据所做的任何更新都可以反映出来。

完成此 Code Pattern 后,您将能够:

  • 将数据加载到云端的 IBM Db2 实例。
  • 创建在本地运行的 IBM Db2 Graph 实例。
  • 将 IBM Db2 Graph 连接到云端的 IBM Db2 实例,并创建 IBM Db2 Graph 数据库。
  • 在 IBM Db2 数据库上运行 Gremlin 查询。
  • 使用 Jupyter Notebook 分析数据。

流程

流程图

  1. 将现有数据加载到 IBM Db2 数据库中,或使用该数据库中的现有数据。
  2. 运行 IBM Db2 Graph Docker 容器。IBM Db2 Graph 将连接到云端的 IBM Db2 数据库,并创建一个覆盖文件,该文件允许用户使用 IBM Db2 Graph 运行 Gremlin 查询。
  3. 使用 Jupyter Notebook 分析数据。

操作说明

准备好行动了吗?在 README 中查看完整的说明,了解以下操作的详细步骤:

  1. 获得代码
  2. 在云端创建 IBM Db2 服务
  3. 创建模式并加载数据
  4. 在本地运行 IBM Db2 Graph
  5. 将 IBM Db2 Graph 连接到 IBM Db2 数据库
  6. 运行 Gremlin 查询
  7. 安装 Anaconda 环境以运行 Jupyter Notebook
  8. 配置 IBM Db2 驱动程序
  9. 运行 Jupyter Notebook 以查看可视化效果

本文翻译自:Analyze data patterns to find fraudulent insurance claims(2020-07-30)