#推理
2 articles
将LLM重新定义为自主AI代理的四个维度——代理型推理框架的体系化
以“Large Language Model Agent”综述论文(arXiv:2503.21460)为起点,围绕规划、工具使用、记忆、自我改进四个维度对代理型推理进行体系化。本文将阐述Silo-Bench、MC-Search等LLM代理研究的最前沿。
NVIDIA Vera Rubin — 显著降低推理成本的下一代AI基础设施
技术解析NVIDIA在CES 2026和GTC 2026上发布的下一代AI平台“Vera Rubin”。该平台将代币(token)成本最多降低到Blackwell的十分之一,并通过与Groq LPU的集成,实现了Agent型AI的大规模部署。