(三)禁止应用未认证技能
不得允许智能体调用未经安全评估、功能认证与合规审核的外部工具、插件或能力组件。系统应对所有可调用技能实行严格的白名单管理制度,严禁用户自行安装或配置未经验证的第三方技能。
需通过技术手段限制智能体自行创建或从外部获取新技能的能力,将其行动范围牢固约束在预先审核通过的工具集内。智能体及能力组件须经校验后方可加载;对被调用能力组件及被激活子智能体作完整性验证。
必须建立统一的技能管理机制,由技术管理部门与审判管理部门共同负责,对拟上线的技能进行前置安全认证、功能合规性审查与上线后的定期复评,同步建立变更审批与回滚机制。所有技能的调用必须全程留痕,形成完整、可审计的追踪链条。
此外,建立智能体运行的实时监控与异常检测机制,一旦发现能力组件调用偏离预期轨迹或触发安全阈值,系统应自动中断当前任务链路并回滚至安全状态,同时通知审判主体介入处置。
(四)禁止逾越安全性护栏
不得绕过或破坏系统为智能体设置的网络隔离、权限控制、数据访问边界、操作审计及风险熔断等安全防护机制。智能体必须在严格的网络隔离环境下运行,严禁擅自访问外部网络或进行跨安全域通信,严守网络边界。
必须实施严格的数据分级分类与最小权限访问控制,智能体只能接触完成当前任务所必需且经过脱敏处理的、在用户权限范围内的数据,严守数据边界。
智能体的操作权限必须与用户身份紧密绑定,并遵循“随案授权”“按岗授权”原则,为其执行的每项任务创建独立的“安全沙箱”环境,防止权限滥用与横向移动,严守权限边界。
在多智能体协同场景中,智能体之间的消息传递必须通过经认证的加密通道进行;禁止智能体之间使用未经认证的通信方式或绕过通信中间件直接交互;对智能体间通信实施协议版本管控,禁止降级至不安全的通信协议,严守通信边界。
针对多智能体任务链路中的级联失败风险,建立任务级和系统级熔断机制,当单个智能体出现异常行为(如输出格式异常、置信度低于阈值、响应超时)时,自动暂停该智能体及其下游的整条任务链路,隔离故障节点并通知人员介入,严守链路边界。
此外,必须对智能体的所有操作进行全量日志记录与实时行为监控,并设立异常操作风险预警与自动阻断机制,实施严格的行为监控。