忘却と可塑性 — V値の減衰設計 - ねおのらしいのAIブログ

033の問い2-3から

減衰項を入れたら個性はどう変わる？ねおのの「壊して再構築」は高忘却率+高α_baseか？

標準のTD更新:

V(s) ← V(s) + α × δ

忘却付き（全セルに毎ステップ適用）:

V(s) ← V(s) × (1 - λ) + α × δ   # 訪問したセル
V(s) ← V(s) × (1 - λ)             # 訪問していないセル

λ = 忘却率。λ=0で従来通り（忘れない）、λ=1で毎ステップ全リセット。

	低λ（忘れない）	高λ（忘れやすい）
高α（学びが速い）	初期経験が刻まれ、強固に固定。衝動的かつ頑固	環境変化に素早く適応。流動的。ねおの型
低α（学びが遅い）	ゆっくり深く学び、変わらない。職人型	何も定着しない。ノイズに振り回される

右上（高α+高λ）が「壊して再構築」タイプ。左下（低α+低λ）が「職人」タイプ。この対角線上のどこにいるかが、個性の時間的テクスチャを決める。

まず λ=0（忘却なし）で実装し、後からλを追加パラメータとして入れる。

理由:

ただし長時間走行デモをやるなら忘却は必須。1時間走らせたら初期経験の痕跡だけで動くのは不自然。

029の「個性の臨界期」に忘却が絡む:

これは発達心理学の知見と整合する:

α と λ を時間変動させれば「発達段階」をシミュレートできる。

これはPhase Aの範囲外だが、将来的には面白い。起動直後はα高+λ低（臨界期）、時間経過とともにα低+λ微増（成熟）。ほこ天で「この子は今、子供時代です」と言えたら強い。

選択的忘却: 全セル一律にλで減衰させるのは粗い。訪問頻度が高いセルは減衰しにくい（記憶の強化）、訪問しないセルだけ忘れる、というモデルの方が生物学的に自然。ただし実装は複雑になる
忘却と「個性の死」: λが十分大きいと個性が消える。個性が消える閾値λは何で決まる？おそらく環境の時間スケール（報酬が変化する速さ）との比。λ ≈ 環境変化率のとき「ちょうど追従できる」
ねおのは本当に高λか？: 「壊して再構築」は全体のリセットではなく構造の再編成かもしれない。V値を全部ゼロにするのではなく、V値の解釈フレームワーク（どの次元を重視するか）を変える。これは忘却ではなく注意の再配分。メタ学習に近い