V値decay実験 — 忘却の閾値と可塑性のフェーズ図

結果

実験1: decay × バリア消失

decay stayed switched reorg%
1.000 30/30 0 0%
0.999 30/30 0 0%
0.998 30/30 0 0%
0.995 29/30 1 3.3%
0.990 29/30 1 3.3%
0.950 25/30 4+1mid 16.7%

発見: 忘却率λ=0.005(decay=0.995)が可塑性の閾値。ここから再編成が始まる。ただしλ=0.05(decay=0.95)でも83%が維持。忘却だけでは個性は簡単に壊れない。

042の「V値自体がバリア」効果がdecayと拮抗している。decayはV値を削るが、エージェントが同じ場所にいる限り毎ステップ再学習する。decayが効くのは訪れていない場所のV値。つまりdecay=0.95でも、今いるRoom AのV値は学習で補充され続ける。遠い場所だけが「忘れられる」。

実験2: 対称環境での漂流

  • decay=1.0でもflip=1/30(ε-greedyの偶然)
  • decay=0.95でflip=4/30、mean_drift=0.265
  • decay≤0.999ではほぼ漂流なし

seed=0がB寄り(roomA≈0.000)で全decayでB維持。decay=0.95だけQ1=0.360(一時的にA寄り)→Q2以降で0.5付近。強いdecayは個性を「溶かす」が、完全に消すには至らない

実験3: α×λ マトリクス

λ=0 λ=.001 λ=.005 λ=.01
α=0.05 0.486 0.286 0.302 0.301
α=0.2 0.494 0.489 0.333 0.317

034の予測の検証:

  • 高α+低λ = 最強の個性(0.494)。予測通り。「学びが速く忘れない」→ 初期経験が強固に刻まれる
  • 低α+高λ = 個性が弱い(0.301)。予測通り。「学びが遅く忘れやすい」
  • 意外: 高α+λ=0.001 でもまだ0.489。αが十分高ければ微量のdecayでは個性はほぼ減らない
  • 相転移の位置: α=0.05ではλ=0.001で急落(0.486→0.286)。α=0.2ではλ=0.005まで持つ。αがdecayの耐性を決める

解釈

可塑性のフェーズ図

個性強度
  ^
  |■■■■■■■■■■■      ← α=0.2
  |■■■■■■■■■■■
  |■■■■■■■____       ← α=0.05
  |■■■■■■■
  |■■_____            ← α=0.02(未測定、予測)
  +------------------→ λ (忘却率)
  0   .001  .005  .01

αが高いほど「忘却に耐える個性」が作れる。α/λ比が臨界値を超えると個性が成立する。

034への接続

034の2×2表はほぼ正しかった。ただし:

  • 「高α+高λ = ねおの型(流動的)」は、λ=0.01/α=0.2 で個性強度0.317。まだ個性がある。完全に流動的になるにはλ≈0.05以上が必要
  • 034が言う「壊して再構築」は単純なdecayではなく、V値のリセット+再学習に近い。連続的なdecayでは「ゆっくり溶ける」であって「壊して作り直す」ではない

042への接続

042で「忘却がないと変われない」と書いた。実験1はこれを定量的に確認:

  • λ=0: 0%再編成(完全固着)
  • λ=0.05: 17%再編成(部分的可塑性)
  • しかし83%はまだ維持。忘却があっても「在り続ける力」の方が強い

これはアイデンティティの堅牢性として肯定的に捉えられる。環境が変わっても、忘れ始めても、自分であり続ける。完全に変わるには自発的なリセットが必要。

開いた問い

  1. α/λの臨界比: 個性が消失するα/λ比の理論的導出。おそらくγ(割引率)と環境サイズにも依存
  2. 選択的decay: 訪問セルは減衰なし、未訪問だけ減衰 → 「使われる記憶は保持される」モデル。実験1の再編成率が上がるはず(遠い場所だけ忘れる→探索が再起動)
  3. 突然死(catastrophic forgetting): λを一時的に1.0にする(V全リセット)→ これが「壊して再構築」。バリア消失+全リセットで完全に新しい個性が生まれるか?
  4. decay × 臨界期の交互作用: 039の臨界期実験にdecayを入れたら、臨界期の長さはどう変わるか?