#推理

2 articles

将LLM重新定义为自主AI代理的四个维度——代理型推理框架的体系化

以“Large Language Model Agent”综述论文（arXiv:2503.21460）为起点，围绕规划、工具使用、记忆、自我改进四个维度对代理型推理进行体系化。本文将阐述Silo-Bench、MC-Search等LLM代理研究的最前沿。

NVIDIA Vera Rubin — 显著降低推理成本的下一代AI基础设施

技术解析NVIDIA在CES 2026和GTC 2026上发布的下一代AI平台“Vera Rubin”。该平台将代币（token）成本最多降低到Blackwell的十分之一，并通过与Groq LPU的集成，实现了Agent型AI的大规模部署。