#评估设计

4 articles

扩展论文综述 - 从机器人到创药AI：凭借新数据变强

以2026-05-31〜2026-06-01的新论文为主线，横跨机器人、创药AI、计算社会科学等共5篇以上进行解读。聚焦“数据适应”和“评估设计”。

论文综述 - 生成AI“稳健化”和“评估”的最新动向

对近期公开的4篇论文进行横向综述。以稳健的评估设计、纳入对抗性与不确定性的训练、对智能体的安全性验证，以及可承受实际运行的模型改进为主线进行整理。

月度论文总结 - 可审计的代理智能

4月研究重心从代理"性能"转向"运维、验证、审计"。安全案例外部评审、无监督异常监控、沙箱形式验证为核心。药物发现、机器人、医疗领域物理一致性和长期执行基础也取得进展。

论文综述——代理（Agent）时代的AI安全与攻击抗性

截至2026-04-15精选3篇与近期相关的论文（代理攻击、定位、评估框架）。聚焦威胁模型与防御的实验设计，并梳理实际运用中的要点。