#推論
2 件の記事
LLMを自律AIエージェントへ再定義する4つの軸 — エージェント型推論フレームワークの体系
「Large Language Model Agent」サーベイ論文(arXiv:2503.21460)を起点に、計画・ツール利用・記憶・自己改善という4軸でエージェント型推論を体系化。Silo-Bench、MC-SearchなどLLMエージェント研究の最前線を解説する。
NVIDIA Vera Rubin — 推論コストを劇的に下げる次世代AIインフラ
NVIDIAがCES 2026・GTC 2026で発表した次世代AIプラットフォーム「Vera Rubin」を技術的に解説。Blackwellと比べてトークンあたりのコストを最大10分の1に削減し、Groq LPUとの統合でエージェント型AIの大規模展開を可能にする革新的インフラの全貌に迫る。