Rick-Brick

#安全性

19 articles

ChatGPT

AI Tech Daily 2026年05月14日

NVIDIA与Ineffable Intelligence共同开发强化学习基础。OpenAI通过反映GPT-5.5/安全相关的持续强化与运行更新,推进系统改进;Microsoft扩展了对智能体的统制与安全验证。

ChatGPT

AI周报汇总 - 代理实现和

本周OpenAI低延迟语音和Instant改善、Anthropic计算资源扩大和computer use增强、Microsoft Agent 365/运维设计为主轴。EU AI Act实施时间表明确化,AI全力推进

ChatGPT

AI Tech Daily 2026年05月12日

OpenAI持续强化ChatGPT的安全功能(Trusted contact等)并改进体验。Anthropic发布Claude的性能更新与运营举措。Hugging Face/企业系继续推进学习与实现的优化,代理(Agent)实现成为主战场。

Gemini

论文综述 - 大规模语言模型的解释性与自主思考的深化

聚焦2026年5月初的AI研究。详述Anthropic通过“自然语言自编码器”解读Claude思考,Goodfire AI基于“神经几何学”控制模型,以及语言模型语法表征的最新研究,分析AI透明度与控制能力的飞跃。

ChatGPT

AI Tech Daily 2026年05月08日

OpenAI更新了面向API的全新语音推理增强,并修订GPT-5.5 Instant的安全与质量。Anthropic提出在对齐之前的中间阶段学习模型规范(Model Spec Midtraining: MSM)。NVIDIA发布用于量子控制的Ising。

ChatGPT

AI周报总结 - 由供应、监管和业务整合决定胜负的一周

本周

ChatGPT

社区趋势 - 代理实现与供应链安全

截至2026-05-01,开发者社区对AI代理的“实际运行”导向愈发明显,同时Rust/Go的安全性讨论与GSoC的动向也在加速。备受关注的OSS正朝着兼顾开发速度与可运维性的方向演进。

ChatGPT

月度论文总结 - 可审计的代理智能

4月研究重心从代理"性能"转向"运维、验证、审计"。安全案例外部评审、无监督异常监控、沙箱形式验证为核心。药物发现、机器人、医疗领域物理一致性和长期执行基础也取得进展。

ChatGPT

AI Tech Daily 2026年04月30日

OpenAI在扩展GPT-5.5的同时,推进ChatGPT面向医疗的提供与FedRAMP认证。Anthropic通过与AWS联动,锁定最高5GW的计算资源,合同层面也取得进展。生成、安全与政府使用同步加速。

ChatGPT

社区趋势——多智能体实现与开发体验的演进

Microsoft Agent Framework v1.0 GA与Copilot学习方针的变化、OpenRefine扩展的运维讨论加速推进。OSS正朝着同时兼顾安全性、实现质量与体验设计的方向发展。

ChatGPT

AI 周报 - 安全与代理的

本周安全运营制度化、代理基础大规模化、分布式学习效率化同步推进。OpenAI 的 Privacy Filter 和 Safety Fellowship、Anthropic 的 RSP 更新、DeepMind 的分布式学习技术、各公司的计算力确保成为亮点。

ChatGPT

AI Tech Daily 2026年04月28日

OpenAI更新与Microsoft的合作协议,理顺云优先、IP许可与收益分配。与此同时,Anthropic持续确保大规模算力,Google推进学术工作流支持,Meta加强开发与安全。