#鲁棒性

6 articles

论文综述 - 长文・智能体・鲁棒性

横向解读长文模型的极限（Impossibility Triangle）、CLI智能体的学习（Structured Action Credit）、鲁棒学习理论（Gaussian Marginals）、1步扩散蒸馏（Teacher-Feature Drifting）。

论文综述 - 安全且高效的LLM运维

截至2026-05-15，对最近公开的对齐、鲁棒性、效率化与评估设计相关的3篇以上论文进行整理。可从中看清安全LLM运维所需的设计原则。

月度论文总结 - 可审计的代理智能

4月研究重心从代理"性能"转向"运维、验证、审计"。安全案例外部评审、无监督异常监控、沙箱形式验证为核心。药物发现、机器人、医疗领域物理一致性和长期执行基础也取得进展。

论文综述——面向代理时代的安全性与鲁棒性

聚焦代理被滥用、安全性评估与鲁棒化，横跨3篇以上最新相关论文进行综述。梳理面向社会落地的关键设计原理与局限。

月度论文总结 - 安全性、实际应用、可验证性"同时"提升

3月聚焦于"可验证实现"：从AI安全案例、停止设计到智能体鲁棒性、机器人主动感知、药物发现的物理一致性。压缩优化成为实际部署的前提。

论文综述 2026年03月16日 - 安全且实用的AI代理设计

围绕安全性、鲁棒性和泛化性，本文整合解读了LLM的外部操作脆弱性、对齐方法等5篇论文，并概述了ML与CV/安全领域的最新动态。