近日,阿里云正式发布AI云盾(Cloud Shield for AI)系列安全产品,包括全新产品AI安全护栏、升级云安全中心、WAAP和云防火墙,为客户提供模型输入输出安全、AI-BOM(AI资产清单管理)、AI-SPM(AI安全态势管理)、AI应用流量识别、AI BOT防护等能力。
Cloud Shield for AI:大模型应用端到端的安全防护
针对AI时代的安全风险,阿里云建立了三层模型安全防御体系,实现模型应用端到端的安全防护,包括:
- AI基础设施安全,阿里云在AI软件供应链安全、AI算力防护、AI系统漏洞检测/修复等方面进行了全新的能力建设,推出了AI-SPM、AI-BOM等产品;
- AI大模型安全,阿里云推出全新的AI安全护栏(AI Guardrail)产品,覆盖内容合规检测、敏感数据泄露和提示词攻击防护三大能力,保障模型输入输出安全;
- AI应用安全,防护AI应用可能遭受的DDoS攻击、Web入侵、API入侵、AI BOT对抗等问题,阿里云同时引入通义千问VL视觉语言模型强大的理解的推理能力,有效防御Deepfake深度伪造换脸威胁;
AI安全护栏:All In One API
基于大模型所构建的应用,在企业应用、智能客服、教育、社交、游戏等场景均有落地,但价值观诱导、「奶奶漏洞」、模型幻觉、事实错误、模型劫持等客观问题也在威胁用户对其的信任感。
阿里云AI安全护栏是一款专门为保障AI业务的合规性、安全性而打造的产品,适用于预训练大模型、AI服务、AI Agent等各种形态的AI业务,提供端到端的全链路防护体系:
- 合规底线:对生成式AI输入输出的文本内容进行多维度合规审查,覆盖涉政敏感、色情低俗、偏见歧视、不良价值观等风险类别,以及AI交互过程中可能泄露的隐私与敏感数据,并提供数字水印标识,确保AI生成内容符合法律法规与平台规范;
- 威胁防御:针对提示词攻击、恶意文件上传、恶意URL链接等外部攻击行为,可实现实时检测并拦截,规避AI应用的最终用户的风险;
- 模型健康:关注AI模型本身的稳定性和可靠性,针对模型越狱、Prompt爬虫等问题建立了一整套检测机制,防止模型被滥用、误用或者产生不可控的输出,构建AI系统的“免疫防线”;
阿里云安全护栏为客户提供All In One API的调用模式,只需调用一个API,就能同时满足文本、图片、文件、音频、视频等多模态内容的交叉检测,所有相关能力都可以在一次API调用中全部完成检测。同时,AI 安全护栏还与阿里云的 AI 基础设施类产品深度结合,支持在百炼、AI网关、Web应用防火墙中一键开启调用,满足不同业务场景的防护需求。
AI安全护栏产品演示
此外,在AI资产的持续可视方面,阿里云安全推出AI资产情况(AI-BOM)和AI安全态势管理(AI-SPM)能力,为客户建立持续的可见性,看清自己有哪些AI资产,并对其安全状态进行持续性的监控与关注。
AI-BOM和AI-SPM产品展示
目前,阿里云已研发了文本审核、图像审核以及多模态审核等多个大型模型,把最前沿的大模型技术持续注入到AI安全护栏产品中,持续不断地为客户提供行业领先、可信赖的AI安全解决方案。
来源 | 阿里云公众号