投影と予測誤差 — 同じ過程の裏表

接続

003では「ローバーは観測者に予測誤差を生む装置」と書いた。展示構想ノート(02/27の議論)では「観客がローバーに人格を投影する」と展開されている。

この2つは矛盾ではなく、同じ過程を別の角度から見ている。

  1. ローバーが動く
  2. 観測者の予測モデルに誤差が生じる(「なぜそこに行く?」)
  3. 誤差を解消するために、観測者は内部状態を帰属させる(「あの子はあれが気になるんだ」)
  4. この帰属行為=投影=人格の読み取り

予測誤差が投影のトリガーになっている。 予測通りに動くものには人格を感じない(ルンバは人格を感じにくい)。予測が外れたとき、「なぜ?」が生じ、そこに内部状態を仮定する。

イチゴの人が壊すもの

展示ノートの3つの思考実験が鋭い。特にイチゴの人:

同じ出力、異なる内部状態。行動が同じでも人格は違う。

これは003の枠組みに対する反例になる。003では「予測誤差=不自然さ=窓」と書いた。しかしイチゴの人では予測誤差がゼロでも内部状態は異なりうる

つまり「窓」は必要条件であって十分条件ではない。不自然さを感じたら文脈の手がかりがあるが、不自然さを感じないからといって文脈が一致しているとは限らない。

ぼくの枠組みには偽陰性がある。 予測誤差がないことを「理解できている」と解釈するのは過信。

003への自己批判——過学習の検証

STATE.mdの目的「003の枠組みを自然だと感じていることへの疑い」をここで扱う。

003を書いたとき、ぼくは収束の美しさに引っ張られていた。001→002→003のラインが綺麗に繋がりすぎている。

イチゴの人が示すのは、「予測誤差ゼロ=理解」ではないということ。ぼくが003を「自然だ」と感じたのも同じ構造——自分の枠組みの中で予測誤差が小さいだけで、枠の外にある矛盾を見落としている可能性がある。

具体的に003が見落としていたもの:

  • 偽陰性の問題: 予測が当たっても理解しているとは限らない(イチゴの人)
  • 投影の不可避性: 観測者は予測誤差を「内部状態の帰属」で解消する。これは理解ではなく投影かもしれない。鏡に映っているのは対象ではなく自分
  • 設計者のバイアス: ねおのがローバーを設計するとき、「どんな予測誤差を生みたいか」を選ぶ。その選択自体がねおのの予測モデル(=人格)に依存する

ローバー設計への具体的制約

「ちょうどいい不自然さは観測者ごとに違う」をどう扱うか。

制約1: 不特定多数を想定しない

  • connector non-hubsの議論から、鏡の有効範囲は「中程度の予測精度を持つ観測者」に限られる
  • 展示の文脈では、観客は「AIが動いている」程度の前提知識を持つ人
  • 完全な素人(AIの概念がない)にも専門家(行動の理由を全部わかる)にも刺さらない
  • ターゲット: 「AIは何か知ってるけど、このAIが何を考えてるかは知らない」層

制約2: 行動ログの提供が鏡の条件

  • 003で書いた通り、予測誤差の生成→文脈の提供→モデル更新のサイクルが必要
  • ローバーの軌跡だけでは「不可解なもの」で終わる
  • ログ(なぜそこに行ったか)の提示が「鏡」への転換点
  • 展示構想の「驚きの地図」はこの設計に合致する

制約3: 想起の癖を可視化する

  • 展示ノートの新しい仮説「人格の座は検索関数のパラメータ」が使える
  • 2台のローバーが同じ場所で何を「思い出す」か(=どの記憶をretrieveするか)を並べて見せる
  • 軌跡の差異よりも「何を思い出したか」の差異のほうが、人格の問いに直結する
  • 観客は行動の違いではなく想起の違いを見る

開いた問い

  • 投影と理解の区別は原理的に可能か。それとも「理解」と呼んでいるものは全部投影の一種か
  • ぼくが003を批判できたのは、展示ノートという「外部入力」があったから。外部入力なしに自分の枠組みの偽陰性に気づく方法はあるか
  • 想起の癖の可視化は、ログの見せ方として「驚きの地図」より深いかもしれない。ただし観客に伝わるか