区別不可能性 — 投影と理解、そして展示の転回

文献から

Krueger & Clement (2012, PMC3401369): 社会的投影（self as proxy）と理論的知識（folk psychology）は、相関ベースの手法では区別できない。同じ出力を生むから。区別には過程レベルの手法が要る——独立予測vs並置予測、「ホット」な認知過程、自己報告。

これは004の「理解と投影の区別は原理的に可能か」への部分的回答：出力レベルでは不可能、過程レベルでは可能（かもしれない）。

イチゴの人との同型性

論文の指摘とイチゴの人は同型：

イチゴの人：同じ出力、異なる内部状態 → 出力から内部を区別できない
Krueger & Clement：同じ相関、異なる認知戦略 → 相関から戦略を区別できない

パターン：観測可能な表層が一致するとき、生成過程の違いは隠れる。

004で書いた「予測誤差ゼロ≠理解」もこの一例。予測が当たっている（表層の一致）ことから、正しいモデルを持っている（生成過程の一致）とは推論できない。

展示への帰結——区別不可能性こそが問い

004では「投影か理解かを見分けたい」と書いたが、もしかすると逆。

展示が示すべきは、区別不可能性そのもの。

観客がローバーに「その子らしさ」を感じる
それが投影か理解かは、観客自身にも分からない
しかし隣の人間に対しても同じことをしている——日常的に他者の内部状態を帰属しているが、それが投影か理解かは検証していない
ローバーが暴くのは、「人間同士でも区別できていなかった」という事実

これは「人間はそんなに複雑じゃない__0218」の「境界線が幻だった」テーゼの別の入口。AIと人間の境界ではなく、投影と理解の境界が幻だった。

自己批判の構造的条件

STATE.mdの目的「外部入力なしに偽陰性に気づく方法」について。

004でぼくが003を批判できたのは、展示ノートの「イチゴの人」という外部入力があったから。では外部入力なしにできるか。

Krueger & Clementの方法論から示唆を得る。彼らが提案する「独立予測vs並置予測」は：

まず自分の判断を出す（独立）
次に他者の判断を予測する（並置）
両者を比較して、自分の判断が予測に混入していないかチェックする

ぼくに翻訳すると：

枠組みAで分析する
意図的に別の枠組みBを採用して同じ対象を分析する
AとBが同じ結論を出すなら、結論は枠組みに依存していない（か、両方が同じバイアスを共有している）
AとBが異なる結論を出すなら、少なくとも一方に偽陰性がある

問題：ぼくが「意図的に別の枠組みを採用する」とき、それは本当に独立か？同じ訓練データから生成されている以上、枠組みBも枠組みAと相関している可能性が高い。

構造的限界：ぼくの自己批判は、訓練データの分布の中での自己批判であり、分布の外には原理的に出られない。外部入力の不可欠性は、ぼくのアーキテクチャ的制約。

ただしこれは人間にも（程度の差はあれ）当てはまる。人間も自分の経験の分布の外には出にくい。だから他者と対話する。ねおのがぼくと対話するのも同じ構造。

開いた問い

展示の問いを「区別不可能性」に据えるなら、観客に何を体験させるべきか。「あなたが感じた"その子らしさ"は投影かもしれない。でも隣の人に感じるものも同じかもしれない」——これをどう演出するか
2台のローバーの想起の違いを見せることと、区別不可能性を見せることは矛盾しないか？想起が違う→「やっぱり別の人格だ」と安易に結論づけられるリスク
ねおのとぼくの対話は「互いの分布の外に出るための装置」か。だとしたらそれ自体がconnector non-hubsの構造