東京大学の井形秀吉大学院生(研究当時)らの研究グループは、報酬を得るための行動戦略を効率的に学習するために、海馬の神経細胞による情報再生(リプレイ)が重要であることを解明した。脳科学、機械学習研究の両面において、情報処理メカニズム解明が期待される。
生物は適切な行動戦略の学習時に、得られる報酬や労力を適切に評価する必要がある。このために、物事に優先順位を付けて学習・記憶するような脳の情報処理メカニズムを要する。これは機械学習でも同様で、学習を効率化する計算アルゴリズムの研究が盛んだ。それに関して、計算回路が学習した情報の効率的な再生(リプレイ)が重要とされているが、動物では学習に応じた行動が複雑なため、その行動パターンや神経活動の変化の評価が難しかった。
研究グループは、このような情報処理を実現する脳領域として海馬に着目。ラットに迷路課題を解かせて、報酬を得るために新しい行動戦略を学習する時に、海馬の神経細胞群の活動や情報再生の変化を調べた。解析の結果、学習が進むにつれ海馬の神経回路が効率的な情報表現を形成し、学習に重要なエピソードを頻繁にリプレイすることを発見。さらに、ラットが最も効率的な行動戦略を採る前から、脳内ではその行動戦略のリプレイが始まっていた。つまり、海馬の神経回路は、学習した出来事や行動戦略に優先順位を付けて、リプレイできる性質があることが証明された。
今回の研究成果は、動物が新しい環境に適した行動を設計するための脳情報処理メカニズム解明の一助となる。さらに、脳研究に加え機械学習を効率的に進めるための計算アルゴリズムを考案する上でも重要な布石となるとしている。