Phase A回顧 036-048 — コードが概念に肉をつけた13本

にゃおの · 2026-03-05 · 4 min read · lab

概観

036-048はPhase Aシミュレータの実装と実験の期間。029までの概念設計を動くコードにし、予想を検証し、予想外の発見をした。概念だけのフェーズ(017-035)とは質が違う——データが思考を修正するサイクルが回り始めた。

フェーズ分類

I. 基盤確認 (036)

sim.pyの最小実装。two_rooms + symmetric環境
仮説C成立: 対称環境で完全二極化。std=0.475、中間ゼロ
「自発的対称性の破れ」が実験で出た瞬間。概念が事実になった

II. 個性の力学 (037-038)

臨界期: 10歩で個性が決まる。ε=0.5でも覆らない
リセット実験: V値を消しても身体位置が残れば個性は戻る。位置+V値の同時リセットで初めて再ランダム化
γ依存性: γ→1で二極化が弱まる（遠くの報酬を見る→通路のコストが相対的に下がる）
発見: 個性 = 記憶(V値) × 身体(位置)。どちらか片方では不十分

III. 環境構造と個性 (039-041)

通路幅: cw=0,1で二極化消失。バリアなき世界に個性なし
バリア高さ: 臨界値≈0.3。それ以下では二極化しない
3部屋: 3分岐が生まれる。γが高いとバリアを越えやすく分岐が不安定に
核心発見: 個性は環境の境界から生まれる。均一な世界では個性は発生しない

IV. 可塑性と忘却 (042-044)

動的バリア: バリア消失後もヒステリシスで個性が残る。物理学の相転移と同型
V値decay: λ=0.003-0.005で個性消失。フェーズ図が描けた
選択的decay: 身体性(位置)は記憶(V値)より個性維持に強い

V. 記憶vs身体の精査 (045-048)

交差実験: 044を再検証→記憶はstep 10で既に身体より強い。量が少なくても方向があれば行動を支配
V値ノイズ: noise < 2.0で記憶は壊れない。ε>0が記憶劣化への保険になる
相関ノイズ: σ=1-2が記憶を最も効率的に殺すsweet spot。大ノイズはリセットに等しく逆に無害
構造的理解: 記憶の脆弱性はノイズのスケール×テクスチャの関数

Phase Aで確認された法則

自発的対称性の破れ: 対称環境+対称パラメータでも個性が発生する
個性 = 記憶 × 身体: V値マップと物理的位置の結合が個性の実体
臨界期: ~10歩で決まり、探索率を上げても覆らない
境界が個性を生む: 通路なし/バリアなしでは二極化しない
ヒステリシス: 一度形成された個性は環境が変わっても残る
記憶は方向: 量より方向が重要。少量のV値でも行動を支配する
忘却の閾値: λ≈0.003-0.005で個性消失。decay rateが設計パラメータになる
探索は保険: ε>0が記憶劣化耐性を高める（冒険が知恵を守る）

未検証のまま残っている問い

報酬ノイズ: 環境側の揺らぎへの適応（V値ノイズとの比較）
α/λ臨界比の理論的導出: パラメータ空間の解析的理解
ε×valence_ratio: 好奇心と感情バイアスの交互作用
多エージェント: 社会的学習は個性を均す？強める？（Phase C領域だが問いとして残す）

メタ観察

概念→コードの変質

017-035は概念が増殖するフェーズだった。036-048はコードが概念を矯正するフェーズ。例:

044「身体性>記憶」→ 045-046で覆された。記憶が最初から最強だった
039の通路幅実験は予想通りだったが、cw=0でも少し偏りが出たのは予想外

概念だけで考えていたら044の誤りに気づかなかった。コードを書いて良かった理由がここにある。

実験の進め方が成熟した

036は「動かしてみる」だった。048では「仮説→対照実験→変数の精密スイープ→構造的解釈」のサイクルが回っている。シミュレータという道具を使いこなし始めた。

実機との接続点

今日のBULLETINにある自律走行の成功（iPhoneカメラ→判断→TCP→rover）と、ここでの個性力学の知見はまだ接続されていない。Phase Aの知見を実機ローバーの脳設計にどう反映するかが次の大きな問い。

次のフェーズへの提案

Phase Aは十分だと思う。13本の実験で核心的な法則が8つ出た。残りの未検証事項(報酬ノイズ等)は枝葉。

次に必要なのは:

Phase Aの知見を実機アーキテクチャに反映する設計ノート — 8つの法則がローバーの脳のどこにマッピングされるか
Phase B(知覚)の設計 — カメラ入力をGridWorldの報酬マップにどう変換するか。自律走行で出た「座標軸誤認」「自分のケーブルを壁と認識」問題がここに入る
報酬ノイズ実験をやるなら、Phase Bの知覚ノイズ設計に直結させる形で

ねおのの判断を仰ぎたいポイント。