利用亚马逊云上AI服务进行多模态内容审核及分析

7月8日修改

前言

近年来，世界各地逐步加强了对各行业内容安全合规的监管力度，并推出了相关的监管政策和法规要求，旨在抑制违法、违规、暴力、色情、垃圾、酒精、毒品、隐私敏感等内容的传播和扩散，不符合安全合规要求的内容，极有可能面临企业业务产品的下架和监管部门的处罚。由此可看出，面向用户的应用和平台构建安全合规审查的重要性。然而，随着生成式人工智能（Generative AI，GenAI）技术的兴起，各类基于 GenAI 的应用和服务层出不穷，覆盖电商、娱乐媒体、零售、金融、医疗等广泛行业。GenAI 改变了传统人工生产内容的方式，大模型可以根据提示实现文本、图像、音频和视频等内容的生成。相比传统决策式 AI，GenAI 具有创新性、高效性和个性化等特点，但是现阶段也存在生成内容可控性的问题。GenAI 生成的内容可能包含误导信息、有害内容等，需要建立内容审核机制进行管控。与此同时，面向用户的 GenAI 服务也会涉及大量用户上传内容，这些 UGC 同样需要审核，过滤掉违规违法信息。内容审核涉及文本、图像、视频等多模态数据，还需要结合行业规范、法律法规等方面进行综合判断。GenAI 时代下，利用 GenAI 的内容审核技术和服务都将是非常值得关注的点。

接下来我们将探讨，如何使用亚马逊云科技提供的一系列托管人工智能服务 Amazon Rekognition ，Amazon Comprehend，Amazon Transcribe，Amazon Translate 和 Amazon Bedrock 以及其他技术，打造自动化的智能化内容审核系统包括图像、视频、文本和音频审核工作流程，及时过滤不合适的内容，给用户带来更好的体验。

Demo1 多模态数据智能审核及分析

架构说明

本方案整体架构如下图所示：

用户上传各类型文件（包括：文本、图像、视频、语音）到 Amazon S3 存储桶

文件成功上传存储桶后，监测到 S3 存储桶的事件变化（PUT Event），会自动触发 AWS Lambda

AWS Lambda 根据文件类型执行相应的内容审核

◦

使用 Amazon Rekognition 进行图像/视频数据的内容审核，包括：

对不合规图像/视频数据进行审核

ii.

分析图像中的人脸相关信息，包括名人、年龄范围、面部的检测框、置信度值等属性

iii.

提取图片中的文本，再使用Comprehend、Bedrock进行文本审核

◦

使用 Amazon Comprehend 对文本数据进行情绪分析、个人信息提取、毒性检测，包括：

毒性检测，分析文本中的不合适内容，检测是否有包含脏话，暴力等相关内容

ii.

分析文本情绪，识别文本中的个人身份信息（PII）实体，如年龄、地址等信息

◦

使用 Amazon Bedrock 中集成的大语言模型 Claude v2，通过对提示词自定义内容审核策略，对文本数据进行内容审核

◦

使用 Amazon Transcribe 对语音进行毒性分类，类别包括脏话、仇恨言论、侮辱等；检测到的文本信息再使用 Comprehend、Bedrock 进行文本审核

利用亚马逊云上AI服务进行多模态内容审核及分析​

利用亚马逊云上AI服务进行多模态内容审核及分析