Nature速递:动态行为重组介导大脑中多巴胺的奖励分配

1,232次阅读
没有评论

Nature速递:动态行为重组介导大脑中多巴胺的奖励分配


关键词:强化学习,奖励分配问题,学习机制

Nature速递:动态行为重组介导大脑中多巴胺的奖励分配

Nature速递:动态行为重组介导大脑中多巴胺的奖励分配

论文题目:Dynamic behaviour restructuring mediates dopamine-dependent credit assignment论文来源:Nature论文地址:https://www.nature.com/articles/s41586-023-06941-5
想象一下,你正在教一只狗玩捡球游戏。你扔出一个球,你的狗在后面冲刺,捡起球,然后跑回来。然后,你用食物奖励气喘吁吁的小狗。但现在对你的狗狗来说,真正的诀窍来了:找出是哪个环节获得了奖赏。科学家将此称为大脑中的“奖励分配问题”(credit assignment)
动物在探索新环境时会表现出多种多样的行为,并能学会哪些行为或行为序列能产生积极的结果。遇到奖励时释放多巴胺对于强化产生奖励的行为至关重要。然而,要了解在连续行为中如何为产生多巴胺释放的确切动作分配奖励一直是个挑战。本文采用一种新的自我刺激范式(self-stimulation paradigm)研究了这一问题,其中特定的自发动作会触发多巴胺能神经元的光遗传刺激。多巴胺自我刺激能迅速、动态地改变整个行为的结构。
最初的刺激不仅强化了刺激产生的目标动作,还强化了与目标动作相似的动作和刺激前几秒钟发生的动作。重复配对使行为逐步完善,从而锁定目标。对动作序列的强化进一步揭示了细化的时间依赖性。自发相隔较长一段时间的动作配对促进了逐步的奖励分配,其中最接近刺激的动作在早期得到完善,而较远的动作则在随后得到完善。多巴胺不仅能发出奖励信号,还能对一系列行为进行微调,随着时间的推移,这些行为会变得更加集中和精确。
因此,回溯强化机制不仅能促进强化,还能逐步完善整个行为,从而为导致多巴胺释放的特定动作和动作序列的奖励分配。这项研究对教育人工智能等领域具有重要意义,让人们深入了解大脑错综复杂的学习机制。
这一发现可能会影响教育和人工智能AI等多个领域,例如,在课堂上允许探索、犯错和逐步完善可能更符合我们大脑与生俱来的学习过程。在人工智能领域,这些见解可能会带来更复杂、更高效的学习系统。通过更好地复制生物学习过程,我们可以创造出更善于适应新数据和新情况的人工智能。


编译|郭瑞东

神经动力学模型读书会

Nature速递:动态行为重组介导大脑中多巴胺的奖励分配

详情请见:

500+神经动力学社区成员,邀你共同点亮更多脑科学研究的岛屿

推荐阅读

1. 大脑对时间的弹性感知,竟然和强化学习中的奖励有关2. 为何有人沉迷赌博?从非理性行为解读决策中的奖励-好奇冲突 | Nat.Comput.Sci.速递3. 动物是如何学习的?线虫神经连接组里有答案!4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程5加入集智学园VIP,一次性获取集智平台所有内容资源6. 加入集智,一起复杂!


点击“阅读原文”,报名读书会


 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 12 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

Failed to fetch content Read More 
LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了

LeCun离职前的吐槽太猛了 一水 2025-12-21 19:13:08 来源:量子位 “LLM到不了AGI...
自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026 一水 2025-12-21 19:11:12 ...