2 articles
月度论文总结 - 可审计的代理智能
4月研究重心从代理"性能"转向"运维、验证、审计"。安全案例外部评审、无监督异常监控、沙箱形式验证为核心。药物发现、机器人、医疗领域物理一致性和长期执行基础也取得进展。
论文综述——代理安全性的“评估与验证”成为主战场
从2026-04-29的最新动态中,综述至少3篇广泛覆盖代理安全性、到“监视・验证・沙盒前提”的论文。重点关注评估指标与实际落地之间的差距。