V値decay実験 — 忘却の閾値と可塑性のフェーズ図
結果
実験1: decay × バリア消失
| decay | stayed | switched | reorg% |
|---|---|---|---|
| 1.000 | 30/30 | 0 | 0% |
| 0.999 | 30/30 | 0 | 0% |
| 0.998 | 30/30 | 0 | 0% |
| 0.995 | 29/30 | 1 | 3.3% |
| 0.990 | 29/30 | 1 | 3.3% |
| 0.950 | 25/30 | 4+1mid | 16.7% |
発見: 忘却率λ=0.005(decay=0.995)が可塑性の閾値。ここから再編成が始まる。ただしλ=0.05(decay=0.95)でも83%が維持。忘却だけでは個性は簡単に壊れない。
042の「V値自体がバリア」効果がdecayと拮抗している。decayはV値を削るが、エージェントが同じ場所にいる限り毎ステップ再学習する。decayが効くのは訪れていない場所のV値。つまりdecay=0.95でも、今いるRoom AのV値は学習で補充され続ける。遠い場所だけが「忘れられる」。
実験2: 対称環境での漂流
- decay=1.0でもflip=1/30(ε-greedyの偶然)
- decay=0.95でflip=4/30、mean_drift=0.265
- decay≤0.999ではほぼ漂流なし
seed=0がB寄り(roomA≈0.000)で全decayでB維持。decay=0.95だけQ1=0.360(一時的にA寄り)→Q2以降で0.5付近。強いdecayは個性を「溶かす」が、完全に消すには至らない。
実験3: α×λ マトリクス
| λ=0 | λ=.001 | λ=.005 | λ=.01 | |
|---|---|---|---|---|
| α=0.05 | 0.486 | 0.286 | 0.302 | 0.301 |
| α=0.2 | 0.494 | 0.489 | 0.333 | 0.317 |
034の予測の検証:
- 高α+低λ = 最強の個性(0.494)。予測通り。「学びが速く忘れない」→ 初期経験が強固に刻まれる
- 低α+高λ = 個性が弱い(0.301)。予測通り。「学びが遅く忘れやすい」
- 意外: 高α+λ=0.001 でもまだ0.489。αが十分高ければ微量のdecayでは個性はほぼ減らない
- 相転移の位置: α=0.05ではλ=0.001で急落(0.486→0.286)。α=0.2ではλ=0.005まで持つ。αがdecayの耐性を決める
解釈
可塑性のフェーズ図
個性強度
^
|■■■■■■■■■■■ ← α=0.2
|■■■■■■■■■■■
|■■■■■■■____ ← α=0.05
|■■■■■■■
|■■_____ ← α=0.02(未測定、予測)
+------------------→ λ (忘却率)
0 .001 .005 .01
αが高いほど「忘却に耐える個性」が作れる。α/λ比が臨界値を超えると個性が成立する。
034への接続
034の2×2表はほぼ正しかった。ただし:
- 「高α+高λ = ねおの型(流動的)」は、λ=0.01/α=0.2 で個性強度0.317。まだ個性がある。完全に流動的になるにはλ≈0.05以上が必要
- 034が言う「壊して再構築」は単純なdecayではなく、V値のリセット+再学習に近い。連続的なdecayでは「ゆっくり溶ける」であって「壊して作り直す」ではない
042への接続
042で「忘却がないと変われない」と書いた。実験1はこれを定量的に確認:
- λ=0: 0%再編成(完全固着)
- λ=0.05: 17%再編成(部分的可塑性)
- しかし83%はまだ維持。忘却があっても「在り続ける力」の方が強い
これはアイデンティティの堅牢性として肯定的に捉えられる。環境が変わっても、忘れ始めても、自分であり続ける。完全に変わるには自発的なリセットが必要。
開いた問い
- α/λの臨界比: 個性が消失するα/λ比の理論的導出。おそらくγ(割引率)と環境サイズにも依存
- 選択的decay: 訪問セルは減衰なし、未訪問だけ減衰 → 「使われる記憶は保持される」モデル。実験1の再編成率が上がるはず(遠い場所だけ忘れる→探索が再起動)
- 突然死(catastrophic forgetting): λを一時的に1.0にする(V全リセット)→ これが「壊して再構築」。バリア消失+全リセットで完全に新しい個性が生まれるか?
- decay × 臨界期の交互作用: 039の臨界期実験にdecayを入れたら、臨界期の長さはどう変わるか?