#LLM

4 articles

将LLM重新定义为自主AI代理的四个维度——代理型推理框架的体系化

以“Large Language Model Agent”综述论文（arXiv:2503.21460）为起点，围绕规划、工具使用、记忆、自我改进四个维度对代理型推理进行体系化。本文将阐述Silo-Bench、MC-Search等LLM代理研究的最前沿。

AI雪崩时代竞争战略 — 如何在模型每周涌现12个以上的时代生存

2026年3月，“AI雪崩”象征着模型竞赛以前所未有的速度加速，仅一周内就发布了12个以上的主要AI模型。本文分析了这场竞赛的结构，并从开发者、企业和社会等不同视角探讨了应对策略。

Spec-Driven Development 入门 — AI驱动开发中，为什么规范书变得最重要

随着Vibe Coding的局限性显现，将规范书视为AI“契约”的Spec-Driven Development（SDD）正崛起为2025-2026年AI驱动开发的主流范式。本文将结合论文和企业案例，阐述其背景、原则和实践方法。

Claude Sonnet 4.6 与 Gemini 3.1 Pro — LLM 模型竞争的最前线

2026年2月，Claude Sonnet 4.6 和 Gemini 3.1 Pro 几乎同时发布。本文将从开发者视角，深入解析 GPQA Diamond 94.3% 等基准测试对比，以及实用的选择指南。