人工智能大模型 · 内容安全 · 多模态审核

"佳宇" —— 内容安全多模态大模型

面向视频内容安全的多模态智能审核系统,综合分析画面、语音、画面文字、字幕、人脸和二维码,为视频发布、内容巡检与人工复核提供可追溯的风险识别能力。

视频内容安全 多模态大模型 PASS / REVIEW / REJECT 可追溯证据链

一、产品定位

佳宇内容安全多模态大模型(Jiayu Content Security LMM) 是一套面向视频的智能内容安全审核系统,帮助视频平台、运营团队和内容审核人员在视频发布、内容巡检和人工复核场景中自动发现潜在风险。

与只看单一画面或只查字幕的审核方案不同,佳宇会同时分析视频中的 画面、语音、画面文字、字幕、人脸和二维码 等多个信息通道,把多个通道的证据汇总起来给出综合结论,并提供可追溯的证据线索,便于人工复核与运营决策。

一句话概括:佳宇把视频内容安全审核从“单点识别”升级为“多模态证据融合 + 可追溯复核”的智能审核闭环。
佳宇内容安全多模态大模型产品功能示意
产品功能示意:多模态输入、风险识别与审核结论输出

二、多模态审核能力

佳宇不是只看单一画面,而是把多个通道的证据汇总后给出综合结论,形成“结论—依据—定位”的闭环。

画面审核识别视频帧中的涉政、色情、暴恐、广告导流等视觉风险,并可结合业务关注场景扩展审核维度。
画面文字识别(OCR)识别字幕、角标、水印、招牌、新闻标题等画面文字,再对文本内容进行敏感与违规分析。
语音内容审核(ASR)将视频语音转换为文本,覆盖辱骂、违禁表述、不当宣传等常见音频风险场景。
人脸识别与敏感人物匹配检测画面人脸并与平台人脸库比对,识别劣迹艺人、涉政人物、公众人物或自定义重点名单。
二维码识别识别画面中的二维码并提取内容,辅助发现外链导流、引流到非合规渠道等风险。
综合判定对整段视频输出统一风险等级和说明,标明风险所在时间范围与对应证据。
PASS 通过 REVIEW 建议人工复核 REJECT 建议拦截

三、审核结果可解释、可复核

视频审核完成后,系统会在结果页集中展示整体结论、风险摘要、关键截图和命中详情,让审核人员能够快速回答“能不能通过、风险在哪里、为什么判定有风险”。

佳宇内容安全多模态大模型敏感人物与素材审核示意
敏感人物、素材内容与多模态审核场景示意
佳宇内容安全多模态大模型风险内容审核示意
涉政、暴恐、广告导流等风险内容审核场景示意

四、典型使用流程

  1. 打开系统:在浏览器中访问审核控制台。
  2. 提交视频:上传视频文件,或者提交一个视频地址。
  3. 等待自动审核:系统并行完成抽帧、画面识别、OCR、语音识别、人脸识别、二维码识别和综合判定。
  4. 查看审核结果:在结果页查看整体结论、风险摘要、命中截图和语音片段。
  5. 按结论处理:PASS 直接通过,REVIEW 人工复核后决定,REJECT 建议拦截或下架。

整个流程无需编写代码,也无需了解内部引擎细节,运营、审核、风控和内容安全团队即可直接使用。

五、适用场景

场景典型用法
短视频与社区平台发布前审核、发布后抽检、用户举报复核。
直播与点播平台录播回放审核、剪辑素材审核、内容库巡检。
在线教育课程视频、宣传视频、用户上传内容的合规审核。
电商与营销商品视频、带货短视频、广告导流风险识别。
企业私有化场景数据不出域,按项目在本地或内网环境部署。

六、产品价值

多模态覆盖同时看画面、文字、语音、人脸和二维码,减少单通道漏检。
结果可解释不只给一个分数,还给出时间点、截图、文本和命中依据。
人工复核友好风险帧和风险语音可直接查看,减少翻找视频的时间。
策略可运营人脸库和敏感词库可由运营在线维护,适应不同业务变化。
本地化部署支持内网环境运行,适合对数据安全要求高的客户。

七、部署形态

佳宇可按客户需要提供两种部署形态:

具体部署方案与硬件要求以商务与交付方案为准。

内容安全多模态大模型视频审核OCRASR人脸识别二维码识别私有化部署