なぜAIはあなたのコンテキストを忘れ続けるのか。そしてどう解決するか
AIがあなたのコンテキストを忘れ続けるのは、新しいチャットが毎回白紙から始まり、コンテキストウィンドウ、つまり一度に保持できる限られた量の文章に収まる分しか「見えない」からです。AIには、あなたの文書も、前回の会話も、状況についての記憶も組み込まれていません。これを解決するのは、ますます長いプロンプトを書くことではなく、自分のファイルから持続的で検索可能なコンテキストを与え、すべての回答に正確な出典を引用させることです。本稿では、なぜ忘却が起きるのか、よくある回避策がなぜ不十分なのか、そして本当に持続する解決策とは何かを順に見ていきます。

AIに同じ説明を繰り返している気がしませんか?
月曜日にチャットボットを開き、先週の火曜日に貼り付けたのと同じ背景を貼り付けます。顧客は誰か、プロジェクトは何を対象にするか、どの規則が適用されるか。良い回答が得られます。翌日、AIはその何も覚えておらず、あなたはまた一からやり直します。このループに覚えがあるなら、あなたが何かを間違えているのではありません。これらのツールの仕組みの基本的な限界にぶつかっているのです。
この苛立ちが本物なのは、仕事が本物だからです。法務、研究、財務、オペレーションで本格的な仕事をする人は、おもちゃで遊んでいるのではありません。AIに自分のコンテキストを知り、知り続けてほしいのです。忘れられると、ツールは負担をそっとあなたに戻します。あなたがAIの記憶役になり、同じコンテキストを何度も与え直すのです。これこそ解決する価値のある問題です。

AIが忘れる理由:コンテキストウィンドウをやさしく
AIモデルにはセッション間の記憶がありません。あなたの個別の状況について知っていることはすべて、毎回モデルの前に置かれる必要があり、それはコンテキストウィンドウ、つまり一度に考慮できる文章の最大量(トークンで測られ、1トークンはおよそ単語の4分の3)の中に収まります。あなたのプロンプト、貼り付けた文書、これまでの会話、そして書かれる回答が、その一つの予算を共有します。
ですから「忘れる」のは不具合ではなく、初期状態です。新しいチャットが始まるとウィンドウは空です。ウィンドウを超えると、古い内容は視界から外れます。モデルは人間のように忘れているのではなく、あなたのコンテキストをそもそもどこにも保存しておらず、与えた分も持続しないのです。この考えを覚えておいてください。重要なのはウィンドウの大きさではなく、あなたのコンテキストがどこに存在し、肝心なときにどうやってモデルの前に届くか、です。
長いプロンプトやファインチューニングでは解決しない
ありがちな対処はそれぞれ壁にぶつかります。プロンプトをどんどん長くしても、ウィンドウを早く埋めるだけで、結局あなたは毎セッション手作業ですべてを貼り直しており、手間は消えません。自分のデータでモデルをファインチューニングするのは、費用がかかり、更新が遅くて古くなり、検査も引用もできない重みに知識を焼き込むため、出典をたどれないままです。
巨大な会話を延々と続ける方法は、初期のコンテキストが静かにウィンドウから押し出され、モデルが1時間前に「知っていた」ことと矛盾し始めるまでは役立つように見えます。どれも、あなたが本当に欲しいもの、つまり持続し、最新で、検証できるコンテキストを与えてはくれません。痛みを取り除くのではなく、移動させているだけです。

うまくいく解決策:検索と引用
持続する解決策は、コンテキストをモデルの外、つまり自分の文書のライブラリに保ち、質問ごとに関連する箇所だけを取得することです。これは検索拡張生成、RAGと呼ばれます。すべてをウィンドウに詰め込む代わりに、ツールがファイルを検索し、その質問に関係する数箇所だけを引き入れ、モデルはそこから答えます。あなたの実質的な知識はどんなウィンドウよりはるかに大きくできます。知識はライブラリに存在し、毎回関連する一部だけが読み込まれるからです。
検索は回答を検証可能にもします。これは実務で最も重要な部分です。モデルは具体的に取得された箇所をもとに作業するため、よく作られたツールはそれぞれを引用でき、あなたは正確な出典を開いて、信用するのではなく確認できます。持続するコンテキストと引用、この組み合わせこそが、説明の繰り返しのループをついに終わらせます。
AIがついにあなたのコンテキストを持つと、どう感じるか
日々の違いは静かですが大きいものです。AIを準備するのをやめ、ただ尋ねるようになります。必要な背景は自分のライブラリから引き出されてすでにそこにあるので、「これらの契約書で更新条件について何を合意したか」といった質問が、該当する条項を正確に引用した直接の回答を返し、あなたは12のファイルを読み直す代わりに数秒で検証します。もうあなたはAIの記憶役ではありません。
これこそTatsulokが目指す体験です。文書を非公開のライブラリに保ち、平易な言葉で質問すると、すべての回答が出典の該当箇所まで引用され、ハイライト表示されたプレビューと元の文書へのリンクで示されます。コンテキストはセッションやサーフェスをまたいで持続し、文書とプロンプトはいかなるAIモデルの学習にも使われず、通信時も保管時も暗号化され、誰が何を見られるかはあなたが制御します。AIがついにあなたのコンテキストを知り、しかもそのすべての回答を証明できるのです。
FAQ
- なぜChatGPTのようなAIは、前に伝えたことを忘れるのですか?
- モデルにはセッション間の記憶がなく、回答する瞬間にコンテキストウィンドウへ収まる分しか考慮できないからです。新しいチャットは空から始まり、会話がウィンドウを超えると以前の内容は視界から外れます。ツールが意図的に保持して取得しない限り、あなたのコンテキストはどこにも保存されません。
- もっと大きなコンテキストウィンドウのモデルを使えばいいのでは?
- 大きなウィンドウは役立ちますが、根本問題は解決しません。すべてが一つの予算を共有し、非常に大きなコンテキストは遅く費用もかさみ、結局あなたは毎セッション手作業でコンテキストを与え直しています。コンテキストを検索可能なライブラリに保つほうが、ウィンドウに詰め込もうとするよりはるかにうまくスケールします。
- 自分の文書でモデルをファインチューニングするのが答えですか?
- たいていは違います。ファインチューニングは費用がかかり、更新が遅く古くなり、検査も引用もできない重みに知識を焼き込みます。検索はあなたの文書を生きた検証可能な出典として保ち、回答が正確な箇所を引用できます。ファインチューニングにはこれができません。
- RAGとは、簡単に言うと何ですか?
- RAG(検索拡張生成)とは、AIが学習した内容だけに頼るのではなく、質問に関連する箇所を文書群から検索し、そこから答えることです。自分のファイルから、持続的で最新かつ引用可能なコンテキストをモデルに与える方法です。
- これを行いながら文書を非公開に保つには?
- 設計上、非公開なツールを使ってください。Tatsulokでは、あなたの文書とプロンプトはいかなるAIモデルの学習にも使われず、通信時も保管時も暗号化され、既定で非公開、アクセスは人ごと・チームごとにあなたが制御します。