AI2026-05-17
Context Window(コンテキストウィンドウ)
別名: Context Window / コンテキストウィンドウ / Context Length / コンテキスト長
LLMが一度の推論で処理できるトークン数の上限。長いほど長文書や長い会話履歴を扱えるが、計算コストとメモリが増大する。現在のフロンティアモデルは数十万〜数百万トークンを実現している。
概要
コンテキストウィンドウはLLMが一度に'記憶'できるテキスト量を決定します。入力(プロンプト+会話履歴+参照ドキュメント)と出力(生成テキスト)の合計がこの上限を超えると、古い情報が切り捨てられるか処理がエラーになります。2026年時点では、Claude 3.5が200K、Geminiが1M〜2M、Qwen 3.6 Plusが1Mトークンを実現しています。
RAGとの関係
コンテキストウィンドウが無限であれば理論上全ドキュメントを直接注入できますが、コスト・レイテンシの観点からRAGで必要な情報のみを抽出する設計が現実的です。超長コンテキストモデルでもRAGは検索精度とコストの面で有効なアーキテクチャです。
関連コラム
AI
Qwen 3.6 Plus完全ガイド — 1Mコンテキスト&エージェントコーディングでClaude Opus超えの実力【2026年4月最新】
Alibaba Cloudが2026年4月2日に発表したQwen 3.6 Plusは、Terminal-Bench 2.0でClaude Opus 4.6を超える61.6を記録。1Mトークンコンテキスト、158 tok/sの高速推論、Claude比17倍のコスト優位性を徹底解説。
Software Development
Claude Code 完全ガイド2026 — AIエージェントコーディングの新時代
Anthropicが開発したClaude Codeは、コードベース全体を理解し自律的にコーディングするエージェント型開発ツールです。CLI、IDE、デスクトップ、Webで利用可能。Opus 4.6、MCP、Agent Teamsなど最新機能を網羅した2026年版完全ガイド。品川区・港区エリアの開発企業様必見。
Software Development
OpenClawで社内ナレッジ検索を構築|RAGによるAIエージェント活用術
OpenClawとRAG(検索拡張生成)を組み合わせて、社内ナレッジベースの高精度な検索システムを構築する方法を解説。ChromaDB・Qdrant・Weaviateなどのベクトルデータベースをローカル環境で運用し、PDF・Word・社内Wikiなどの文書を横断検索できるAIエージェントの構築手順を、品川区周辺の企業事例とともに紹介します。
関連用語
お気軽にご相談ください
お問い合わせ