552605 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

東方見雲録

東方見雲録

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
2024.09.26
XML
カテゴリ:科学

引用サイト:ドーパミンとは 活用法まで解説!  こちら 
・・・・
ドーパミン神経細胞は文脈依存の報酬予測誤差を表現できる
結果を乱暴に要約すると、ー正しいやる気が、学習を促進するとは本当らしい—となります。

ドーパミン神経細胞は、複雑な運動の学習・制御に重要な大脳基底核に豊富に存在します。この細胞が、予測した報酬と実際に獲得できた報酬の違い、「報酬予測誤差」を表す活動を示すことが近年発見されました。この誤差と、強化学習と呼ばれる強力な計算機アルゴリズム(TDモデル)で使用される学習信号の類似性も指摘されました。このドーパミン細胞の活動の解明は、大脳基底核回路の情報処理の解明につながるので、大変注目されています。

各試行で、短い光刺激の後、50%の確率でサルは報酬を得ます(図1)。平均としては50%の報酬予測となります。実際の1試行では、報酬をもらえると+50%の報酬予測誤差、もらえないと-50%の誤差となります。この±50%の誤差に対応する活動がドーパミン細胞に見られます(図1A)。次に、報酬のあり・なしの試行を別々に、その試行の直前までに何回の無報酬の試行が続いたかを横軸にしてプロットしました(PRN、図1B)。両方の線が、正の傾きをもっています。直前の試行まで何があろうと、各試行では報酬の確率が50%なので(non- contextual)、いつでも±50%の予測誤差のはずです。なぜでしょう?実は、これは、TDモデル仮説から予想されるのです(図1C、D)。ドーパミン細胞の活動が報酬予測誤差を表し、それを使い、強化学習による学習が各試行で少しずつ進むと考えます。一方、課題では、確かに平均50%の報酬確率でも、実際には、たまたま報酬(あるいは無報酬)の試行が数回続くことはいくらでもあるので、その数回の局所に限ると報酬確率は必ずしも50%ではありません。このような報酬確率の局所的なゆらぎが、学習のゆらぎを起こし、それがドーパミン細胞の活動に現れるのです。要約すると、課題1では、“文脈”が意味をもたない時には「感覚入力のみに頼るTDモデル」が、ドーパミン細胞の活動と、試行のゆらぎを含め、対応がつくことを確認しました。
引用サイト:こちら
・・・・
ノーベル賞の登竜門とも呼ばれる学術賞を、日本から2人の研究者が受賞しました。

この賞は、イギリスの学術情報会社「クラリベイト社」が、論文の引用回数などをもとに、ノーベル賞クラスの研究をしたと評価できる研究者に与える「引用栄誉賞」です。今年は6か国22人の研究者が受賞。このうち半数は、アメリカの研究者となっています。

日本からは、化学の分野で信州大学アクア・リジェネレーション機構特別特任教授の堂免一成さん。生理学・医学の分野でアメリカの国立眼病研究所に所属する神経科学者、彦坂興秀さんの2人が選ばれました。
・・・・
彦坂さんは、運動制御や学習行動の中心となる、大脳基底核におけるドーパミンニューロンの働きなどについての研究で受賞しています。
引用サイト:日テレ  こちら





お気に入りの記事を「いいね!」で応援しよう

Last updated  2024.09.26 08:00:12
コメント(0) | コメントを書く



© Rakuten Group, Inc.
X