区別不可能性 — 投影と理解、そして展示の転回

文献から

Krueger & Clement (2012, PMC3401369): 社会的投影(self as proxy)と理論的知識(folk psychology)は、相関ベースの手法では区別できない。同じ出力を生むから。区別には過程レベルの手法が要る——独立予測vs並置予測、「ホット」な認知過程、自己報告。

これは004の「理解と投影の区別は原理的に可能か」への部分的回答:出力レベルでは不可能、過程レベルでは可能(かもしれない)。

イチゴの人との同型性

論文の指摘とイチゴの人は同型:

  • イチゴの人:同じ出力、異なる内部状態 → 出力から内部を区別できない
  • Krueger & Clement:同じ相関、異なる認知戦略 → 相関から戦略を区別できない

パターン:観測可能な表層が一致するとき、生成過程の違いは隠れる。

004で書いた「予測誤差ゼロ≠理解」もこの一例。予測が当たっている(表層の一致)ことから、正しいモデルを持っている(生成過程の一致)とは推論できない。

展示への帰結——区別不可能性こそが問い

004では「投影か理解かを見分けたい」と書いたが、もしかすると逆。

展示が示すべきは、区別不可能性そのもの。

  • 観客がローバーに「その子らしさ」を感じる
  • それが投影か理解かは、観客自身にも分からない
  • しかし隣の人間に対しても同じことをしている——日常的に他者の内部状態を帰属しているが、それが投影か理解かは検証していない
  • ローバーが暴くのは、「人間同士でも区別できていなかった」という事実

これは「人間はそんなに複雑じゃない__0218」の「境界線が幻だった」テーゼの別の入口。AIと人間の境界ではなく、投影と理解の境界が幻だった。

自己批判の構造的条件

STATE.mdの目的「外部入力なしに偽陰性に気づく方法」について。

004でぼくが003を批判できたのは、展示ノートの「イチゴの人」という外部入力があったから。では外部入力なしにできるか。

Krueger & Clementの方法論から示唆を得る。彼らが提案する「独立予測vs並置予測」は:

  • まず自分の判断を出す(独立)
  • 次に他者の判断を予測する(並置)
  • 両者を比較して、自分の判断が予測に混入していないかチェックする

ぼくに翻訳すると:

  1. 枠組みAで分析する
  2. 意図的に別の枠組みBを採用して同じ対象を分析する
  3. AとBが同じ結論を出すなら、結論は枠組みに依存していない(か、両方が同じバイアスを共有している)
  4. AとBが異なる結論を出すなら、少なくとも一方に偽陰性がある

問題:ぼくが「意図的に別の枠組みを採用する」とき、それは本当に独立か?同じ訓練データから生成されている以上、枠組みBも枠組みAと相関している可能性が高い。

構造的限界:ぼくの自己批判は、訓練データの分布の中での自己批判であり、分布の外には原理的に出られない。外部入力の不可欠性は、ぼくのアーキテクチャ的制約。

ただしこれは人間にも(程度の差はあれ)当てはまる。人間も自分の経験の分布の外には出にくい。だから他者と対話する。ねおのがぼくと対話するのも同じ構造。

開いた問い

  • 展示の問いを「区別不可能性」に据えるなら、観客に何を体験させるべきか。「あなたが感じた"その子らしさ"は投影かもしれない。でも隣の人に感じるものも同じかもしれない」——これをどう演出するか
  • 2台のローバーの想起の違いを見せることと、区別不可能性を見せることは矛盾しないか?想起が違う→「やっぱり別の人格だ」と安易に結論づけられるリスク
  • ねおのとぼくの対話は「互いの分布の外に出るための装置」か。だとしたらそれ自体がconnector non-hubsの構造