環境複雑さ × valence の交互作用
022と029の統合
022: 反変原理 → 環境の制約が多いほど行動が収束する 029: valence(α+/α-) → 経験の偏った取り込みが個性を生む
この二つは独立じゃない。環境の複雑さがvalenceの効果を調節する。
仮説: 複雑さがvalenceの表現を選択する
単純環境(空の部屋、制約なし)
- 行動の自由度が高い → どの方向に偏っても代償がない
- valenceの差は現れるが、どんな偏りでも等価
- 楽観的ローバーも悲観的ローバーも、結局ランダムウォークに近い
- 個性は生まれるが意味をもたない(環境がフィードバックしないから)
中程度の環境(2部屋+通路)
- 制約がある → 偏りに代償と報酬が伴う
- valenceの差が行動分化に直結: 楽観的=正報酬部屋に居座る、悲観的=負報酬から逃げ回る
- ここが個性が「読める」閾値 → 024のlegibility thresholdと対応
複雑環境(迷路、多部屋、袋小路)
- 制約が多い → 生存に必要な行動パターンが絞られる
- valenceの差が現れる余地が小さくなる → 反変原理的に収束
- ただし完全には収束しない: 同じ巡回路でも「どの角を先に曲がるか」に微差が残る
- 個性は環境に圧縮される: 表現の自由度が狭まるが消えはしない
これが意味すること
個性(選択の癖)の可視性は環境の複雑さのU字型関数かもしれない:
可視性
| *
| * *
| * *
| * *
| * *
+-----------> 環境の複雑さ
単純 中程度 複雑
- 単純すぎる: 個性はあるが意味がない(差が観測できない)
- 中程度: 個性が最もよく表現される(ほこ天デモの最適点)
- 複雑すぎる: 個性が環境に圧殺される(収束が強すぎる)
ほこ天デモへの直接的示唆
029の2部屋環境は「中程度」に相当する。これは偶然ではなく原理的に正しい選択だった。
- 観客に見せるとき、単純すぎると「ただウロウロしてるだけ」
- 複雑すぎると「迷路を解いてるだけ」(個性じゃなくアルゴリズムに見える)
- 2部屋+通路は「こっちの子は明るい部屋が好きで、こっちの子は暗い部屋から離れない」が直感的
Phase Aでの検証
029の実験に「環境複雑さ」を第3軸として追加:
| 環境 | セル数 | 報酬源 | 期待 |
|---|---|---|---|
| 空の部屋 | 20×15 | なし | 個性は出るが無意味 |
| 2部屋 | 20×15 | +1/-1の2域 | 個性が最も可読 |
| 迷路 | 20×15 | 分散した+1が5箇所 | 巡回路に収束、個性は微差 |
ただしこれはvalenceスイープの後。まず029の最小実験が先。
開いた問い
-
「意味のある個性」とは何か? 個性が環境にフィードバックを持つ(行動結果が変わる)ときだけ「意味がある」のか? それとも観測者が読めることが意味の条件? → これは024のlegibility議論の延長。ただし今回は「環境が個性を選択する」という進化論的な構造が入る
-
人間の社会も「中程度の複雑さ」で個性が最も表現されるか? 完全自由(ニート)でも完全拘束(軍隊)でもなく、適度な制約のある社会環境で個性が可読になる? これは社会心理学の強い状況/弱い状況(Mischel 1977)と同じ構造
-
Mischelの状況強度理論: 強い状況(明確なルール、期待される行動がある)では個人差が消え、弱い状況(曖昧、自由度が高い)で個人差が現れる。上のU字カーブとは少し違う — Mischelは単調減少を予測する。差はどこから来る? → おそらく「意味がない個性」をカウントするかどうか。Mischelは観測可能な行動差だけを見ている。ぼくらのモデルでは内部状態(V値の分布)の差も含めている