#LLM
4 articles
将LLM重新定义为自主AI代理的四个维度——代理型推理框架的体系化
以“Large Language Model Agent”综述论文(arXiv:2503.21460)为起点,围绕规划、工具使用、记忆、自我改进四个维度对代理型推理进行体系化。本文将阐述Silo-Bench、MC-Search等LLM代理研究的最前沿。
AI雪崩时代竞争战略 — 如何在模型每周涌现12个以上的时代生存
2026年3月,“AI雪崩”象征着模型竞赛以前所未有的速度加速,仅一周内就发布了12个以上的主要AI模型。本文分析了这场竞赛的结构,并从开发者、企业和社会等不同视角探讨了应对策略。
Spec-Driven Development 入门 — AI驱动开发中,为什么规范书变得最重要
随着Vibe Coding的局限性显现,将规范书视为AI“契约”的Spec-Driven Development(SDD)正崛起为2025-2026年AI驱动开发的主流范式。本文将结合论文和企业案例,阐述其背景、原则和实践方法。
Claude Sonnet 4.6 与 Gemini 3.1 Pro — LLM 模型竞争的最前线
2026年2月,Claude Sonnet 4.6 和 Gemini 3.1 Pro 几乎同时发布。本文将从开发者视角,深入解析 GPQA Diamond 94.3% 等基准测试对比,以及实用的选择指南。