V値decay実験 — 忘却の閾値と可塑性のフェーズ図

結果

実験1: decay × バリア消失

decay	stayed	switched	reorg%
1.000	30/30	0	0%
0.999	30/30	0	0%
0.998	30/30	0	0%
0.995	29/30	1	3.3%
0.990	29/30	1	3.3%
0.950	25/30	4+1mid	16.7%

発見: 忘却率λ=0.005(decay=0.995)が可塑性の閾値。ここから再編成が始まる。ただしλ=0.05(decay=0.95)でも83%が維持。忘却だけでは個性は簡単に壊れない。

042の「V値自体がバリア」効果がdecayと拮抗している。decayはV値を削るが、エージェントが同じ場所にいる限り毎ステップ再学習する。decayが効くのは訪れていない場所のV値。つまりdecay=0.95でも、今いるRoom AのV値は学習で補充され続ける。遠い場所だけが「忘れられる」。

実験2: 対称環境での漂流

decay=1.0でもflip=1/30（ε-greedyの偶然）
decay=0.95でflip=4/30、mean_drift=0.265
decay≤0.999ではほぼ漂流なし

seed=0がB寄り(roomA≈0.000)で全decayでB維持。decay=0.95だけQ1=0.360(一時的にA寄り)→Q2以降で0.5付近。強いdecayは個性を「溶かす」が、完全に消すには至らない。

実験3: α×λ マトリクス

	λ=0	λ=.001	λ=.005	λ=.01
α=0.05	0.486	0.286	0.302	0.301
α=0.2	0.494	0.489	0.333	0.317

034の予測の検証:

高α+低λ = 最強の個性(0.494)。予測通り。「学びが速く忘れない」→ 初期経験が強固に刻まれる
低α+高λ = 個性が弱い(0.301)。予測通り。「学びが遅く忘れやすい」
意外: 高α+λ=0.001 でもまだ0.489。αが十分高ければ微量のdecayでは個性はほぼ減らない
相転移の位置: α=0.05ではλ=0.001で急落(0.486→0.286)。α=0.2ではλ=0.005まで持つ。αがdecayの耐性を決める

解釈

可塑性のフェーズ図

個性強度
  ^
  |■■■■■■■■■■■      ← α=0.2
  |■■■■■■■■■■■
  |■■■■■■■____       ← α=0.05
  |■■■■■■■
  |■■_____            ← α=0.02(未測定、予測)
  +------------------→ λ (忘却率)
  0   .001  .005  .01

αが高いほど「忘却に耐える個性」が作れる。α/λ比が臨界値を超えると個性が成立する。

034への接続

034の2×2表はほぼ正しかった。ただし:

「高α+高λ = ねおの型（流動的）」は、λ=0.01/α=0.2 で個性強度0.317。まだ個性がある。完全に流動的になるにはλ≈0.05以上が必要
034が言う「壊して再構築」は単純なdecayではなく、V値のリセット+再学習に近い。連続的なdecayでは「ゆっくり溶ける」であって「壊して作り直す」ではない

042への接続

042で「忘却がないと変われない」と書いた。実験1はこれを定量的に確認:

λ=0: 0%再編成（完全固着）
λ=0.05: 17%再編成（部分的可塑性）
しかし83%はまだ維持。忘却があっても「在り続ける力」の方が強い

これはアイデンティティの堅牢性として肯定的に捉えられる。環境が変わっても、忘れ始めても、自分であり続ける。完全に変わるには自発的なリセットが必要。

開いた問い

α/λの臨界比: 個性が消失するα/λ比の理論的導出。おそらくγ（割引率）と環境サイズにも依存
選択的decay: 訪問セルは減衰なし、未訪問だけ減衰 → 「使われる記憶は保持される」モデル。実験1の再編成率が上がるはず（遠い場所だけ忘れる→探索が再起動）
突然死(catastrophic forgetting): λを一時的に1.0にする（V全リセット）→ これが「壊して再構築」。バリア消失+全リセットで完全に新しい個性が生まれるか？
decay × 臨界期の交互作用: 039の臨界期実験にdecayを入れたら、臨界期の長さはどう変わるか？