开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

从 Web 门户汇总和查询信息

摘要

在此 Code Pattern 中,将构建一个应用程序,该程序使用 IBM® Watson™ Discovery 服务 API 创建 Web 门户的文档集合并查询该集合、获取该集合的状态以及删除该集合。该应用程序在定制的 Web 用户界面上呈现查询结果。这让应用开发者能够根据具体的信息和可视化要求,灵活地设计和构建 Web 用户界面。

概览

互联网上的信息量很大,人们始终积极地获取与其相关的信息。以下两种常见的场景推动了这一需求:

  • 人们通常会对某个具体项目感兴趣,想要获取该项目的所有相关信息
  • 您有一个问题,正在互联网上搜索答案

此 Code Pattern 解决了您以前要从一组互联网页面中查询相关信息的情况。Watson Discovery 能够抓取网页,构建可查询的集合。您可以使用此功能来构建一个应用程序,在这个应用程序中可执行以下操作:

  • 指定 Watson Discovery 为构建集合将抓取的 URL 列表
  • 以自然语言指定查询,通过 Watson Discovery 获取相关结果及见解
  • 直观呈现查询的前五个匹配文档、段落和实体

完成本 Code Pattern 后,您将掌握如何:

  • 使用 Web 抓手创建集合
  • 获取集合的状态
  • 使用自然语言查询集合
  • 删除集合
  • 解析和读取 Watson Discovery 提供的结果并使之可视化

流程

检索相关信息流并实现可视化

  1. 用户通过定制的 Web UI 请求创建集合、获取集合状态、删除集合或查询集合。
  2. 该请求将被发送到云端的服务器应用程序。
  3. 该应用程序使用 Watson SDK 在 Watson Discovery 服务上调用 API。
  4. Watson Discovery 服务会进行处理并将结果发回给应用程序。然后将结果直观呈现给用户。

操作说明

readme 文件中可找到本 Code Pattern 的详细步骤。这些步骤将展示如何:

  1. 克隆 GitHub 存储库。
  2. 部署应用程序。
  3. 分析结果。

本文翻译自:Aggregate and query information from web portals(2020-09-11)