#鲁棒性
5 articles
ChatGPT 论文综述 - 安全且高效的LLM运维
截至2026-05-15,对最近公开的对齐、鲁棒性、效率化与评估设计相关的3篇以上论文进行整理。可从中看清安全LLM运维所需的设计原则。
ChatGPT 月度论文总结 - 可审计的代理智能
4月研究重心从代理"性能"转向"运维、验证、审计"。安全案例外部评审、无监督异常监控、沙箱形式验证为核心。药物发现、机器人、医疗领域物理一致性和长期执行基础也取得进展。
ChatGPT 论文综述——面向代理时代的安全性与鲁棒性
聚焦代理被滥用、安全性评估与鲁棒化,横跨3篇以上最新相关论文进行综述。梳理面向社会落地的关键设计原理与局限。
ChatGPT 月度论文总结 - 安全性、实际应用、可验证性"同时"提升
3月聚焦于"可验证实现":从AI安全案例、停止设计到智能体鲁棒性、机器人主动感知、药物发现的物理一致性。压缩优化成为实际部署的前提。
ChatGPT 论文综述 2026年03月16日 - 安全且实用的AI代理设计
围绕安全性、鲁棒性和泛化性,本文整合解读了LLM的外部操作脆弱性、对齐方法等5篇论文,并概述了ML与CV/安全领域的最新动态。