样本高效的基于模型的量子控制强化学习

Sample-efficient Model-based Reinforcement Learning for Quantum Control

解决问题：本篇论文旨在提出一种基于模型的强化学习方法，以解决量子控制中的噪声时变门优化问题，并通过减少样本复杂度来提高效率。这是一个新问题。

关键思路：该论文的关键思路是使用可微分的ODE（ordinary differential equations）来表示模型，通过学习可学习的Hamiltonian ansatz来近似环境，同时与系统进行交互来解决控制问题。相比于当前领域的研究，该论文的思路在于将ODE应用于量子控制领域，以提高效率。

其他亮点：本文的实验采用了含有单次测量、任意希尔伯特空间截断和哈密顿参数不确定性的现实数字实验，并在NV中心和transmons上应用了该算法。此外，论文提出的学习到的Hamiltonian可以为现有的控制方法（如GRAPE）提供初始控制器，并且该方法在控制部分表征的一和二量子位系统方面表现良好。然而，该论文未提供开源代码。

关于作者：本篇论文的主要作者是Irtaza Khalid、Carrie A. Weidner、Edmond A. Jonckheere、Sophie G. Shermer和Frank C. Langbein。他们分别来自英国的伯明翰大学和桑德兰大学。他们之前的代表作未在我的数据库中找到。

相关研究：最近其他相关的研究包括“Efficient quantum control using gradient-based algorithms and reinforcement learning”（作者：M. T. Mitchison、M. J. Gullans、M. P. Zaletel，机构：加州大学伯克利分校）、“Quantum reinforcement learning”（作者：A. A. Melnikov、H. Pichler、D. Ebler、P. Zoller，机构：奥地利科学院）等。

论文摘要：我们提出了一种基于模型的强化学习方法，用于噪声时变门优化，相较于基于模型的无模型强化学习，我们的方法具有更好的样本复杂度。样本复杂度是指控制器与物理系统交互的次数。我们利用归纳偏差，受到神经常微分方程最近进展的启发，使用一个可微分的常微分方程，其参数由可学习的哈密顿量假设表示，以表示近似环境的模型，其时变部分（包括控制）是完全已知的。通过与系统的交互，我们解决了连续时间独立参数的哈密顿学习和控制问题。我们在实际数字实验中展示了我们的方法在准备一些标准的单量子门（包括闭合和开放系统动力学）方面，在样本复杂度方面比标准的基于模型的无模型强化学习方法有一个数量级的优势。数字实验中还包括单次测量、任意希尔伯特空间截断和哈密顿参数的不确定性。此外，学习到的哈密顿量可以被现有的控制方法（如GRAPE）利用，以便进行进一步的基于梯度的优化，其中强化学习找到的控制器作为初始化。我们在本文中应用于氮空位中心和转子，适用于控制部分特征化的一和二量子比特系统。

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

样本高效的基于模型的量子控制强化学习

腾讯Q3财报：AI生态价值释放，To B营收双位数增长至582亿元

北京人形开源最新VLM模型，推动具身智能再迈关键一步 !

openEuler发布超节点操作系统，引领AI时代

比0.99元羊毛更重要的，是跟AI砍价的快乐

雷军下铺的兄弟，创业家务机器人

谁在带队小鹏机器人：IRON背后的四位关键人物

医疗AI质变时刻来临！国产医疗AI率先突破，临床诊疗能力问鼎全球

孙正义再次清仓英伟达！上一次教训“价值2500亿美元”

罗福莉C位亮相小米，离职DeepSeek后首次官宣

华为刚投的物理AI：首家国产世界模型公司