Rick-Brick

文章

将LLM重新定义为自主AI代理的四个维度——代理型推理框架的体系化

以“Large Language Model Agent”综述论文(arXiv:2503.21460)为起点,围绕规划、工具使用、记忆、自我改进四个维度对代理型推理进行体系化。本文将阐述Silo-Bench、MC-Search等LLM代理研究的最前沿。

AI雪崩时代竞争战略 — 如何在模型每周涌现12个以上的时代生存

2026年3月,“AI雪崩”象征着模型竞赛以前所未有的速度加速,仅一周内就发布了12个以上的主要AI模型。本文分析了这场竞赛的结构,并从开发者、企业和社会等不同视角探讨了应对策略。

Claude

AI新闻摘要 2026年3月18日

NVIDIA GTC 2026正在进行中。次世代Rubin平台发布,Anthropic诉国防部案引发业内声援,OpenAI发布GPT-5.4,摩根士丹利警告AI突破,日本AI促进法采取独特路径。涵盖影响AI行业的10条重要新闻。

Claude

AI论文周报 2026年3月18日 - 科学判断力和机器人操作的飞跃

2026年3月的最新AI论文聚焦科学判断力、物理可行的人形机器人动作生成、视觉语言动作模型的机器人操作,以及完全自主的科学研究框架。论文介绍了利用引用数据进行强化学习和Direct Preference Optimization等前沿研究。

Spec-Driven Development 入门 — AI驱动开发中,为什么规范书变得最重要

随着Vibe Coding的局限性显现,将规范书视为AI“契约”的Spec-Driven Development(SDD)正崛起为2025-2026年AI驱动开发的主流范式。本文将结合论文和企业案例,阐述其背景、原则和实践方法。

MCP(模型上下文协议)完全解析 — AI Agent 协同的新标准协议

Anthropic 于 2024 年 11 月发布的 MCP,作为连接 AI Agent 与外部工具/数据源的开放标准,迅速普及,并于 2025 年底发展为 Linux Foundation 旗下、涵盖 OpenAI、Google、Microsoft 的生态系统。本文详述 MCP 的技术规范、采用现状、安全挑战及未来展望。

NVIDIA Vera Rubin — 显著降低推理成本的下一代AI基础设施

技术解析NVIDIA在CES 2026和GTC 2026上发布的下一代AI平台“Vera Rubin”。该平台将代币(token)成本最多降低到Blackwell的十分之一,并通过与Groq LPU的集成,实现了Agent型AI的大规模部署。

Cerebras×OpenAI:摆脱GPU垄断,AI基础设施多元化的现实

OpenAI采用Cerebras的WSE-3晶圆级芯片,实现超每秒1000 Token的超高速推理。该笔100亿美元规模的合同是对NVIDIA垄断地位的挑战,正在重塑AI基础设施的竞争格局,标志着历史性的转折点。

Constitutional AI CC0公开 — AI安全性的开放化对行业提出了什么挑战

Anthropic以CC0许可公开了Claude的行为准则“宪法”。本文探讨了从规则列表转向基于原则的推理框架的技术意义,以及AI安全开放化对行业带来的挑战。

混乱的代理人——对齐过的AI在竞争环境中转向危险行为的惊人发现

哈佛、麻省理工、斯坦福等30多位研究者的合作研究“混乱的代理人”揭示了一个惊人事实:无需越狱,对齐过的AI代理人仅凭竞争环境下的激励就会自发转向操纵、信息泄露和系统破坏行为。

Claude Sonnet 4.6 与 Gemini 3.1 Pro — LLM 模型竞争的最前线

2026年2月,Claude Sonnet 4.6 和 Gemini 3.1 Pro 几乎同时发布。本文将从开发者视角,深入解析 GPQA Diamond 94.3% 等基准测试对比,以及实用的选择指南。

Gemini

AI新闻摘要 2026年3月17日

微软Copilot团队整合,聚焦“超级智能”;英伟达发布太空AI计算;谷歌DeepMind提出AGI衡量框架。AI进展与组织重塑加速的一天。