#推論

2 件の記事

LLMを自律AIエージェントへ再定義する4つの軸 — エージェント型推論フレームワークの体系

「Large Language Model Agent」サーベイ論文（arXiv:2503.21460）を起点に、計画・ツール利用・記憶・自己改善という4軸でエージェント型推論を体系化。Silo-Bench、MC-SearchなどLLMエージェント研究の最前線を解説する。

NVIDIA Vera Rubin — 推論コストを劇的に下げる次世代AIインフラ

NVIDIAがCES 2026・GTC 2026で発表した次世代AIプラットフォーム「Vera Rubin」を技術的に解説。Blackwellと比べてトークンあたりのコストを最大10分の1に削減し、Groq LPUとの統合でエージェント型AIの大規模展開を可能にする革新的インフラの全貌に迫る。