発表のポイント

  •  状況に応じた柔軟な行動を可能とする認知・学習・情動制御の新たな神経回路機構を提案
  •  大脳-中脳回路の理論モデルで二重の結合間の自律的整合が起こる可能性及び条件を発見
  •  統合失調症における神経興奮/抑制バランスの異常と複数の症状を結ぶ新たな機序を示唆

発表内容

 近年、ヒトや動物の行動の神経機構を、強化学習理論などに基づく神経回路の計算論モデルを用いて理解しようとする研究が盛んに行われるようになってきました。しかし、外界の状態の適切な内部表現を獲得する仕組みや、状況に応じて適切に動機づけを変える仕組みは、まだあまり明らかになっていません。

 この度、東京大学大学院教育学研究科准教授・ニューロインテリジェンス国際研究機構連携(WPI-IRCN)研究者の森田賢治博士と、スウェーデン王立工科大学計算科学技術部門准教授のArvind Kumar博士は、先行研究(自身らによるものも含む)で提案されてきたモデルを組み合わせた、大脳皮質-基底核-中脳の新たな神経回路モデルを構築し、その動作を解析しました。そして、大脳皮質から基底核を経由した中脳への結合と(逆方向の)中脳ドーパミン細胞から大脳皮質への投射、および、基底核から中脳への結合と(逆方向の)中脳ドーパミン細胞から基底核への投射が、二重に、自律的に整合(feedback alignment)することで、状態の適切な内部表現の獲得、および状況に応じた適切な動機づけの両方が可能となることを示しました。

 さらに、そのような自律的な整合が起こるために、大脳皮質の興奮/抑制バランスが肝要であることを、初めて見出しました(図1)。バランスが過興奮に偏ると、整合が劣化し、さらに一方は逆転して逆相関の状態になり、状況に応じた適切な動機づけ、および、得られた価値に対する先行状態の貢献度の適切な割り当て(credit assignment)に支障が生じることが示されました。これは、かねてから統合失調症の神経基盤と考えられてきた大脳皮質-基底核-中脳神経回路の異常、その中でも主要なものの一つとして示唆されてきた大脳皮質の興奮/抑制バランスの偏り(過興奮)が、いかにして、統合失調症の主要な症状である陰性症状(意欲・動機付けの障害などを伴う)および陽性症状(幻覚・妄想などを伴い貢献度割り当ての障害とも考え得る)を引き起こしうるかについて、新たな潜在的説明を与えるものと考えられます。

 この可能性を、今後、より精緻な理論モデルで検証し、さらには実験によって検証していくことが期待されます。一方、今回明らかになった機構の根幹を成す神経結合の自律的な整合(feedback alignment)は元々、人工知能(AI)で中心的に用いられているアルゴリズムである誤差逆伝播法の、生物学的に実装しうる代替法として提案されたものであることを踏まえると、本研究の成果は、AIとは異なるヒトや動物の知性(ニューロインテリジェンス)の解明にも寄与しうると考えられます。なお、東京大学は、スウェーデン王立工科大学(今回の共同研究相手)とストックホルム大学・カロリンスカ研究所によって構成されるストックホルムトリオと、2017年以来、戦略的パートナーシップ協定を締結しており、本研究は、そのさらなる発展にも貢献すると期待されます。



図1:二重の、神経結合の自律的整合と、その大脳皮質の興奮/抑制バランスへの依存性

大脳皮質の興奮/抑制バランス(A)が抑制優勢の場合(グラフの3200試行より左の部分)、大脳皮質から基底核を経て中脳への結合と(逆方向の)中脳ドーパミン細胞から大脳皮質への投射の間の相関(B)、および基底核から中脳への結合と(逆方向の)中脳ドーパミン細胞から基底核への投射の間の相関(C)がいずれも正となる。すなわち、いずれにおいても、両方向の結合が自律的に整合する"feedback alignment"が起こる。(何らかの原因で)大脳皮質の興奮/抑制バランスが変化し興奮優勢になると(グラフの3500試行付近より右の部分)、大脳皮質-中脳間(B)・基底核-中脳間(C)いずれも相関が弱まり(整合が劣化し)、後者は逆相関になる。これにより、状況に応じた適切な動機づけ、および、得られた価値に対する先行状態の貢献度の適切な割り当て(credit assignment)に支障が生じる。

発表者・研究者等情報

東京大学
大学院教育学研究科
 森田 賢治 准教授
   兼:東京大学国際高等研究所ニューロインテリジェンス国際研究機構(WPI-IRCN) 連携研究者

論文情報

雑誌名:The Journal of Neuroscience
題 名:Mesocorticostriatal reinforcement learning of state representation and value with implications for the mechanisms of schizophrenia
著者名:Kenji Morita and Arvind Kumar
DOI: 10.1523/JNEUROSCI.1762-25.2026
URL: https://doi.org/10.1162/NECO.a.38

研究助成

本研究は、科研費「生物学的に妥当なリカレントニューラルネットワークを用いた最適状態表現の学習(課題番号:25H02594)」、「習慣的および目標指向的行動制御系の促進的・抑制的働きの状況依存性およびその脳機構(課題番号:23K27985)」の支援により実施されました。

問合せ先

<研究内容について>
東京大学大学院教育学研究科
准教授 森田 賢治(もりた けんじ)