ChatGPTは、見えているのに、読めているとは限らない。

生成AIを相手にしていると、ふと足元が揺れる瞬間がある。検索窓に言葉を入れなくても「調べて」と頼めば答えが返る。情報源らしき表示も付く。ならば、AIは検索し、読み、理解したのだろうと、多くの人は自然に受け取る。だが、その自然さの中に、いま見過ごされている段差がある。問題は、AIが間違うことではない。もっともらしく答えられるがゆえに、利用者が「いま何が起きたのか」を見失いやすいことにある。

検索できるのか、できないのか

ChatGPTは、ある場面では実際にウェブ検索を行い、情報源を示しながら答える。ところが別の場面では、自ら「ウェブアクセスはできない」と説明することがある。利用者から見れば、検索できるのか、できないのか、その区別がつかない。しかも厄介なのは、この混乱が単なる言い回しの揺れではなく、製品体験そのものの中に埋め込まれている点だ。

普通の会話では、相手が自分の状態を説明できることを前提にしている。見たのか、見ていないのか。読んだのか、読んでいないのか。外部情報を参照したのか、自分の知識だけで話しているのか。人間同士なら、その区別は会話の土台になる。ところが生成AIでは、その土台が静かに崩れることがある。できることと、自分でそう説明できることが一致しない。ここに、新しい種類の不透明さがある。

そこが一番こわいとこやろ、って話である。できるかどうかより先に、「自分がいま何をしたか」を安定して語れない。そのズレの方が、実はずっと本質的だ。

賢さではなく、透明性の問題

このズレは、単純な能力不足とは少し違う。ツールの作動と、モデルの自己記述が、同じ層に置かれていないように見えるからだ。検索機能が呼び出されることはある。だが、その事実をモデル自身が一貫して説明できるとは限らない。利用者は自然に「AIがそう言ったのだから本当だろう」と受け取る。しかし現実には、AIの自然言語による説明より、UIに出る情報源表示やソース一覧の方が、何が実際に起きたかをより正確に示している場面がある。

これは知能の問題というより、透明性の設計の問題だ。AIが十分に賢くないから混乱するのではない。むしろ、かなり流暢に、かなり自然に、自分の状態を説明してしまうからこそ、利用者はその説明を信じてしまう。だが、その説明主体そのものが、常に自分の作動状態を正確に把握しているわけではない。このねじれが、生成AI時代のUXの中核にある。

「検索した」と「読んだ」は違う

さらに大きいのは、検索と読解を人が同じものとして受け取りやすいことだ。情報源が出た、引用らしきものが付いた、それだけで「AIはそのページ本文を読んだのだろう」と思ってしまう。だが実際には、そこにいくつもの段階差がある。ページの存在に触れただけかもしれない。タイトルや周辺断片に触れただけかもしれない。本文の一部しか取得していないかもしれない。十分に参照できているかもしれない。ところが現在の体験では、その違いが利用者の側からほとんど見えない。

見えているのに、読めているとは限らない。ここに検索AI特有の誤認が生まれる。従来の検索エンジンなら、利用者は自分でリンクを開き、自分で本文を読み、どこまで確認したかを自分で管理していた。だが生成AIでは、その一部をAIに委ねる。すると本来は、「どこまで委託が成功しているか」を示す表示が必要になる。いま足りていないのは、まさにそこだ。

ページに触れたんと読破したんを同じ顔でしゃべったらダメやろ、と突っ込みたくなる。けれど利用者の前では、その区別がまだ薄い。

誤答ではなく、状態の見えなさ

この問題を「たまに間違うAI」の話として片づけるのは甘い。核心は誤答そのものではない。利用者が、どの状態の返答をいま受け取っているのかを判別しづらいことにある。検索していない返答。検索したが断片しか見ていない返答。ページには触れたが本文全体は読めていない返答。十分な検索と参照が行われた返答。本来なら、この差はひと目で分かるべきだろう。

ところが現状では、多くの利用者はモデルの語り口からそれを推測するしかない。そしてそのモデル自身が、自分の状態を安定して説明できない場合がある。すると、AIがAIを説明する悪循環が起きる。説明主体そのものが不正確であり得る以上、仕様説明を自然言語出力だけに委ねても、利用者体験は安定しない。必要なのは「うまく説明できるAI」ではなく、「説明が揺れても、事実状態はUIで確認できる製品設計」である。

一般利用者ほど、誤解しやすい

リテラシーの高い利用者なら、引用の有無やソース表示、リンクの実在性から違和感を拾えるかもしれない。だが多くの人は、そこまで見ない。AIに聞いて、答えが自然で、もっともらしければ、それを受け入れる。検索窓に戻るより先に、会話を続ける。そのとき起きているのは、単なる誤情報の流入ではない。自分はいま何を根拠に納得させられているのか、その土台が見えなくなることだ。

これは情報の問題である前に、認知誘導の問題でもある。しかも生成AIは、その誘導を悪意なく、なめらかに行ってしまう。便利さが信頼を先取りするとき、必要なのは性能競争ではなく、状態表示の設計になる。何をしたのか。何をしていないのか。どこまで見たのか。どこから先は見ていないのか。そうした境界線が曖昧なままでは、利用者は「AIが知っていること」と「AIがうまく話していること」を区別できない。

求められるのは、頭の良さより作動の見え方

改善の方向は、実はそれほど抽象的ではない。検索が実行されたのかどうか。外部ページ本文に到達したのかどうか。断片参照なのか、全体読解なのか。引用表示が実在ソースと連動しているのか。こうした情報を、モデルの口頭説明ではなく、製品UIの側で明示することだ。

利用者が知りたいのは、「ChatGPTは検索できます」という一般論ではない。いま自分に返ってきたこの文章が、どの状態で生成されたのか。その一点である。そこが見えるだけで、対話の意味は大きく変わる。AIは魔法ではなく、検証可能な道具になる。逆に、そこが曖昧なままでは、賢さは信頼にならない。むしろ、不透明さを上品に包む技術になってしまう。

生成AIは、検索を不要にするのではない。検索の意味を変えている。その変化に製品側の表示設計が追いつかなければ、利用者は「見えている」ことと「読めている」ことを取り違え続けるだろう。いま問われているのは、AIが何を知っているかではない。AIが、自分の知らなさと、自分の到達範囲を、利用者の前でどこまで正直に可視化できるかである。

フロントランナーとして見るなら、この問題は単なる不具合ではない。生成AIが社会の道具になっていくなら避けて通れない、信頼の設計そのものだ。見えないまま便利になっていく技術ほど、あとで大きな説明責任を背負う。ならば、いま必要なのは、答えを増やすことではない。答えの状態を、もっとはっきり見せることだろう。