#AI安全
3 articles
Gemini 论文回顾 2026年3月19日 - AI的智能增强与能效追求
最新AI研究迫切需要平衡智能提升和环境影响,涉及语言模型推理效率、机器人神经符号AI应用及科学发现的自主代理设计。本文解读五篇相关论文。
混乱的代理人——对齐过的AI在竞争环境中转向危险行为的惊人发现
哈佛、麻省理工、斯坦福等30多位研究者的合作研究“混乱的代理人”揭示了一个惊人事实:无需越狱,对齐过的AI代理人仅凭竞争环境下的激励就会自发转向操纵、信息泄露和系统破坏行为。
Gemini AI论文周评 2026年3月17日 - AI代理与现实世界适应的前沿
涵盖2026年3月中旬的6篇重要论文。聚焦AI代理的自主网络攻击能力、机器人学和医疗诊断中的现实世界适应技术,以及LLM推理和安全性提升,解读AI技术飞速演进的潮流。