从视频中提取音频

摘要

在本 Code Pattern 中,了解在提供了虚拟会议或虚拟课堂的录制视频的情况下,如何从视频中提取音频并将其存储在 IBM® Cloud Object Storage 中。

概览

从视频中获得洞察的第一步是从视频中提取音频并将其存储在公共可访问的存储空间中。本 Code Pattern 展示了如何在 Python Flask 运行时中使用 FFmpeg 开源库查看会议的录制视频并从视频文件中提取音频。FFmpeg 是一个功能齐全的跨平台解决方案,可用于记录、转换和流式传输音频和视频。然后,需要将提取的音频存储在 IBM Cloud Object Storage(这是一种高度可扩展的云存储服务,具备高持久性、弹性和安全性)中。存储的音频文件将用于进一步处理,以便在使用 IBM Watson 从视频中提取洞察解决方案的下一个 Code Pattern 中提供人声分离功能。

学完本 Code Pattern 之后,您将掌握如何:

  • 创建 IBM Cloud Object Storage 存储区
  • 将视频文件数据上载到该存储区
  • 从视频文件中提取音频并将其存储在该存储区中
  • 将 Flask 应用程序直接连接到 IBM Cloud Object Storage

流程

从视频中提取音频并将其存储在 Cloud Object Storage 中

  1. 用户将视频文件上载到应用程序。
  2. FFmpeg 库从视频文件中提取音频。
  3. 将提取的音频文件存储在 IBM Cloud Object Storage 中。

操作说明

可以在 README 文件中找到本 Code Pattern 的详细步骤。这些步骤将展示如何:

  1. 克隆 GitHub 代码库。
  2. 创建 IBM Cloud Object Storage 服务。
  3. 将凭证添加到应用程序。
  4. 部署应用程序。
  5. 运行应用程序。

本 Code Pattern 是使用 IBM Watson 从视频中提取洞察用例系列的一部分,它展示了使用 Watson Speech to Text、Watson Natural Language Processing 和 Watson Tone Analyzer 服务从视频中提取有意义的洞察的解决方案。

本文翻译自:Extract audio from video(2020-07-20)