AI2026-05-17

Context Window（コンテキストウィンドウ）

別名: Context Window / コンテキストウィンドウ / Context Length / コンテキスト長

LLMが一度の推論で処理できるトークン数の上限。長いほど長文書や長い会話履歴を扱えるが、計算コストとメモリが増大する。現在のフロンティアモデルは数十万〜数百万トークンを実現している。

概要

コンテキストウィンドウはLLMが一度に'記憶'できるテキスト量を決定します。入力（プロンプト+会話履歴+参照ドキュメント）と出力（生成テキスト）の合計がこの上限を超えると、古い情報が切り捨てられるか処理がエラーになります。2026年時点では、Claude 3.5が200K、Geminiが1M〜2M、Qwen 3.6 Plusが1Mトークンを実現しています。

RAGとの関係

コンテキストウィンドウが無限であれば理論上全ドキュメントを直接注入できますが、コスト・レイテンシの観点からRAGで必要な情報のみを抽出する設計が現実的です。超長コンテキストモデルでもRAGは検索精度とコストの面で有効なアーキテクチャです。

Context Window（コンテキストウィンドウ）

概要

RAGとの関係

関連コラム

関連用語