IBM Code Model Asset eXchange (MAX) 是一站式交流平台,开发人员可在此查找和使用免费的开源深度学习模型。自 2018 年初 MAX 首次发布以来,我们已帮助许许多多的数据科学家和人工智能开发人员轻松发现、评估、训练机器学习与深度学习模型并在他们的人工智能应用中进行部署。再接再厉,我们很高兴地宣布我们的第二批模型资产以及相应的 Code Pattern 现已推出,并通过一些简便示例为开发人员提供帮助。

这些新出炉的模型资产涵盖机器学习/深度学习(ML/DL) 的诸多领域,包括音频、图像、文本识别以及癌症检测:

  • Breast Cancer Mitosis Detector

    该模型由 IBM CODAIT teamTUPAC16 辅助的有丝分裂数据集上进行训练,可检测到乳腺癌肿瘤细胞出现有丝分裂的情况。它可以构成更大的模型管道,用于预测整张活检组织图像上的肿瘤增殖分数。

    可能的用例:通过肿瘤图像,自动诊断癌症严重性程度,协助做出治疗决策。

  • Audio Embedding Generator

    该模型以嵌入向量的形式从音频数据提取特征,支持数据科学家构建以声音作为输入的机器学习模型。

    可能的用例:音频嵌入可用作其他任务的输入信息,比如音频分类或音频去重。

  • Image Segmenter

    该模型可识别出图像中的物体,也可以生成分割图,内含针对图像中每个像素预测的物体类别。

    可能的用例:从视频流中实时标记人或物。

  • Word Embedding Generator

    该模型使用 Swivel 算法生成词嵌入。您需要在 IBM Watson 机器学习上训练这个模型。

    可能的用例:嵌入内容可用作其他 NLP 任务的输入信息,比如情绪分析、文本摘要等等。

  • Image Colorizer

    该模型由 IBM CODAIT 团队进行训练,可将灰度图像转换为彩色。

    可能的用例:为老旧的黑白照片添加色彩。

  • Audio Classifier

    这个模型使用从 Audio Embedding Generator 提取的音频特征,为简短声音片段构建分类器。

    可能的用例:一款能够通过声音检测枪击、闯入、撞击或其他重要事件的安全应用,可以加快紧急救援服务的响应速度。

    IBM CODAIT 团队还创建了一个 Code Pattern ,用于说明如何训练和评估音频分类器模型,并用它来对 IBM Watson Studio 的深度学习即服务平台上的音频嵌入进行分类。

除了提供新的模型资产以外,我们还增强了某些现有的模型资产:

  • 以下模型资产现在可在 Fabric for Deep Leaning (FfDL) 上进行训练,这是一个面向深度学习结构服务产品框架的开源项目,这类框架包括 TensorFlow、PyTorch、Caffe 以及在 Kubernetes 上作为服务的其他框架。
  • 为示范如何在应用中使用 MAX 模型,我们发布一个 Code Pattern,用于展示利用 MAX 模型创建 Web 应用有多简单。该应用将来自 MAX 的 Image Caption Generator 包装成一个简单的 Web UI,支持您根据该模型给出的描述筛选图像。
  • 我们还随 MAX Object Detector 模型包含了一个微型 Web 应用,支持用户上传图像,检测图像中的物体,与模型输出信息直观互动。该 Web 应用可随模型 API 一同部署,无需用户额外执行其他步骤。我们计划未来要对该应用进行扩展,创建一个独立的 Web 应用,示范如何在应用中使用该模型。

除了这些新的模型资产和相关的 Code Pattern,IBM CODAIT FfDL 团队还围绕 IBM Fabric for Deep Learning 的使用发布了两篇全新的Code Pattern:

访问 IBM Code Model Asset eXchange (MAX) 站点,浏览这些模型和增强功能。我们希望您能找到符合您自身人工智能开发需求的内容。我们也欢迎大家提供意见和建议,帮助我们不断改进,更好地为 ML/DL 社区服务。

本文翻译自:Announcing newly released models in the IBM Code Model Asset eXchange(2018-07-12)

加入讨论