2 articles
月度论文总结 - 可审计的代理智能
4月研究重心从代理"性能"转向"运维、验证、审计"。安全案例外部评审、无监督异常监控、沙箱形式验证为核心。药物发现、机器人、医疗领域物理一致性和长期执行基础也取得进展。
论文综述 - LLM智能体的“经验压缩”与“安全的运行”
以最新arXiv的3篇LLM智能体相关论文为主线,梳理实现经验压缩以支持长期运行的框架,以及面向人与/或环境的安全评估与验证的研究趋势。