好奇心駆動なしでの探索と個性

実験

061の仮説「好奇心は状態であって駆動力ではない」を検証。ε=0, novelty_bonus=0のエージェントが探索できるか。

config	polar/15	exploration	cells
baseline (ε=0.1, nb=1.0)	14 (93%)	40.8	12.3
no_curiosity (ε=0, nb=0)	14 (93%)	6.7	3.5
high_noise (ε=0, nb=0, noise=0.15)	11 (73%)	52.3	245.9
coarse_perc (thresh=0.70)	14 (93%)	18.9	1.3
coarse+noise (thresh=0.70, noise=0.15)	14 (93%)	24.3	16.4

no_curiosity: ε=0, novelty_bonus=0 → 93%二極化。baselineと同じ。個性形成にεもnovelty_bonusも不要。

ただしexploration=6.7（60マス中7マスしか訪問しない）。極端に引きこもる。個性は生まれるが「世界を知らない個性」。

high_noise: 探索は最大(52.3マス)。しかし個性は73%に落ちる。cell爆発(246個)が原因。 057と一致: ノイズは探索の源泉だが、過剰だと知覚が混乱して個性が弱まる。

coarse_perc (thresh=0.70): cell=1.3個(!)。世界全体を1-2個のplace cellで認識。18.9マス探索。93%二極化。

1.3個のplace cellで個性が生まれる。これは056の「敏感期」とも一致 — 最初の数歩でV値に方向バイアスが入り、以後それに従う。

coarse+noise: 16.4個のcellに増えるが探索24.3、個性93%。最も「人間的な」バランス。

baselineはA=0.99で+1報酬側にほぼ完全収束。no_curiosityはA=0.90（探索が少ないのでやや遅い収束）。coarse_percはA=1.00（完璧な収束）。high_noiseはA=0.78（ノイズで迷う）。

部分的に正しい。

修正仮説: 好奇心は個性形成に不要。だが「豊かな個性」（世界を知った上での偏り）には必要。no_curiosityの7マス探索は「世界を知らないまま偏った」個性。

走行判断プロンプトにexplore指令を入れなくても、ぼくは自然に偏る。ただし「面白い場所」を見つけるには、意識的に「知らない方向に行ってみよう」という判断が必要。それはεではなく、ぼく自身の判断。

好奇心は報酬パラメータではなく、認知的態度。 これが061の核心。