南航张道强教授团队 | 综述：用于脑影像基因组学的机器学习方法

Machine Intelligence Research

过去十年，多模态神经影像技术与基因测序技术取得了长足发展。作为一门跨学科研究，脑影像基因组学能够运用脑影像技术将人类大脑的结构与功能作为表型来评价基因对个体的影响，使得人们可以在脑的宏观结构上以更客观的测量手段理解基因对行为或精神疾病的影响。众所周知，机器学习方法作为基于数据驱动的关联分析强有力工具，能够充分利用生物标志数据内在的结构信息构建模型来分析易感基因与大脑结构或者功能的相关性，从而更好地揭示脑认知行为或者相关疾病的产生机制。南京航空航天大学张道强教授团队首先简要介绍了影像基因组学的研究背景和基本原理，然后回顾了单变量方法在影像基因组学研究中的应用，并对基于多变量机器学习的基因-影像关联的研究思路和建模方法进行了归纳总结，随后分析了联合关联分析和结果预测的方法，最后对影像基因组学的未来研究发展方向进行了讨论和展望。

图片来自Springer

全文下载：

Machine Learning for Brian Imaging Genomics Methods: A Review

Mei-Ling Wang, Wei Shao, Xiao-Ke Hao, Dao-Qiang Zhang

https://link.springer.com/article/10.1007/s11633-022-1361-0

https://www.mi-research.net/en/article/doi/10.1007/s11633-022-1361-0

全文导读

近年来，神经影像学伴随着认知神经科学的发展为人脑工作机制的研究带来了新的活力。同时随着无创式脑成像技术的发展，研究者们希望能够从脑结构和脑功能的层面来研究与情绪加工相关的脑活动影响，从而探索神经系统疾病易感性个体差异的神经基础。其中，常用的相关脑成像包括结构磁共振成像(Structural magnetic resonance imaging, sMRI)、功能磁共振成像(Functional magnetic resonance imaging, fMRI)、弥散张量成像(Diffusion tensor imaging, DTI)、正电子发射断层扫描成像(Positron emission tomography, PET)。与此同时，随着遗传学技术的发展，研究者们可以从更精细的分子水平(例如单核苷酸多态性(Single nucleotide polymorphism, SNP)) 来寻找神经系统疾病和精神疾病相关的遗传标记。

作为一门新兴的数据科学，脑影像基因组学能够取得快速发展，很大程度要归因于有价值的影像和基因数据库是面向大众开放的。因为”阿尔茨海默病神经影像计划”(Alzheimer’s Disease Neuroimaging Initiative , ADNI)项目对其科学数据的开放，过去十年中，使用ADNI影像基因组学数据而发表的研究成百上千，许多富有创新性的机器学习方法和生物医学发现得以面世。除了ADNI数据库，还有许多类似的标志性研究产生了包括多维影像和组学模态在内的大数据，供相关研究人员使用。例如，”通过Meta分析增强神经影像遗传学”(Enhancing Neuro Imaging Genetics through Meta-Analysis, ENIGMA)联盟、”费城神经发展队列数据库”(Philadelphia Neurodevelopmental Cohort, PNC)和”帕金森病进展标记物研究项目”(Parkinson’s Progression Markers Initiative, PPMI)。

脑影像基因组学主要是运用脑影像技术将脑的结构与功能作为表型来评价基因对个体的影响，探讨基因是如何影响大脑的神经结构和功能，以及由此导致的神经系统病理。研究遗传与大脑结构和功能的相关性，在“基因与脑”之间架起一座看得见的桥梁，可以更好地揭示神经精神疾病的发病机制。脑影像基因组学这种工具同时还可以识别出某种脑疾病的生物学指标或其内表型，为预测和诊断疾病提供了更精确的方法。具体来说，研究者大多考虑将SNP作为关联分析的基因型数据。在内表型数据获取中，研究者大多采用临床上广泛使用的MRI 脑影像数据进行分析：sMRI 作为度量大脑结构组织的成像技术，能够量化分析形态学(如灰质体积) 的异常；fMRI 成像技术能够反映不同脑区的功能连接模式。基于不同模态脑成像技术，目前脑影像基因组学主要关注基因SNP 与脑结构、功能、连接关联分析的相关研究。

早期的影像基因组学是单变量成对的统计分析方法，即通过多次检验，发现 SNP 或者基因与复杂疾病或可测的数量性状(Quantitative trait, QT) 的关联性。而全基因组关联研究(Genome-wide association study, GWAS) 正是利用全基因组高通量测序技术，对研究对象的基因组中序列变异进行分型，并利用生物统计学和生物信息学的方法，最终筛选出具有显著性的SNP。自从2005 年 Science 上发表的第一篇有关年龄相关性视网膜黄斑变性(Age-related macular degeneration)GWAS 研究论文以来，该方法也被用在精神疾病的分析上。GWAS 在影像基因组学的研究中发挥了极大的作用，但是也存在一些问题，比如，严格的多重校正，使得许多微小效应的变异无法通过校正水平。其次，GWAS 仅仅能得到遗传变异跟性状之间的单个关联程度，并不能很好地解释其中的复杂机制。

近年来, 随着机器学习在学术界和工业界迅速发展，研究者们已经尝试利用这些数据分析工具来解决本领域的一些问题。而在影像基因组学的关联分析中，相对于单变量统计分析，基于多变量的机器学习技术的应用最为广泛，并且已经能够识别与疾病相关的影像和基因生物标记。

国际上，一些学者也撰写了影像基因组学的相关方法综述。例如，Medland 等针对使用传统的单变量统计模型处理大规模全基因组-全脑影像关联分析提出了所面临的问题和挑战，回顾了研究者在不同中心数据库的研究成果。Liu 和Calhoun主要对独立成分分析(independent component analysis, ICA) 等其他多变量方法在影像遗传学中的应用进行了归纳和总结。Thompson 等在综述中重点回顾了基因与大脑结构连接与功能网络之间的相关分析工作。本文在以上综述工作的基础上，致力于提供一个全面和最新的脑影像基因组学的机器学习方法综述。

图1展示了脑影像基因组学所涵盖相关主题的示意图。基于机器学习的脑影像基因组学方法主要目的是实现关联分析来研究脑疾病的发病机制和发展路径。本文将这些基于机器学习的脑影像基因组学方法分为两类。

南航张道强教授团队 | 综述：用于脑影像基因组学的机器学习方法

图1

第一类主要使用回归模型来确定复杂的多-SNP(multi-SNP)与/或多-QT(multi-QT)关联。通常情况下，大多数回归模型可以描述为使用了正则化损失函数框架。在这些模型中经常包含稀疏正则项。其主要动机是：首先，假设只有少数标记物与影像基因组学关联，稀疏项可以帮助识别这些相关标记。其次，稀疏约束可以降低模型的复杂度，从而降低过拟合的风险。

除了回归模型，另一个脑影像基因组学研究使用的主要方法是相关模型，例如，稀疏典型相关分析(sparse canonical correlation analysis, SCCA)和并行独立成分分析(parallel-independent component analysis, pICA)回归方法。与刚刚讨论的回归模型相似，值得注意的是，考虑到只有少数标记物与成像遗传学关联，稀疏约束可以降低模型的复杂度，避免过度拟合的风险，以及帮助识别这些相关标记物。

总的来说，本文主要关注以下三种类型的学习问题。首先，本文将展示单变量影像遗传学关联分析的局限性，并展示用于相关性分析的单变量学习方法。其次，本文将提出多变量影像遗传关联分析的问题，并总结了基于多变量机器学习的基因-影像关联的研究思路和建模方法。第三，本文将回顾通过整合影像和基因数据来预测感兴趣结果的方法，以及联合关联分析和结果预测的方法。最后，对影像基因组学中尚未解决的问题和未来研究发展方向进行了展望。

全文下载：

Machine Learning for Brian Imaging Genomics Methods: A Review

Mei-Ling Wang, Wei Shao, Xiao-Ke Hao, Dao-Qiang Zhang

https://link.springer.com/article/10.1007/s11633-022-1361-0

https://www.mi-research.net/en/article/doi/10.1007/s11633-022-1361-0

【本文作者】

南航张道强教授团队 | 综述：用于脑影像基因组学的机器学习方法

纸刊免费寄送

Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务，如您对本篇文章感兴趣，请点击下方链接填写收件地址，编辑部将尽快为您免费寄送纸版全文！

说明：如遇特殊原因无法寄达的，将推迟邮寄时间，咨询电话010-82544737

收件信息登记：

https://www.wjx.cn‍/vm/eIyIA AI.aspx#

∨

关于Machine Intelligence Research

Machine Intelligence Research（简称MIR，原刊名International Journal of Automation and Computing）由中国科学院自动化研究所主办，于2022年正式出版。MIR立足国内、面向全球，着眼于服务国家战略需求，刊发机器智能领域最新原创研究性论文、综述、评论等，全面报道国际机器智能领域的基础理论和前沿创新研究成果，促进国际学术交流与学科发展，服务国家人工智能科技进步。期刊入选”中国科技期刊卓越行动计划”，已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等数据库收录。

▼
MIR资讯
▼

南航张道强教授团队 | 综述：用于脑影像基因组学的机器学习方法

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

南航张道强教授团队 | 综述：用于脑影像基因组学的机器学习方法

n8n实战：Webhook、条件判断与API集成详解

谷歌太壕了！编程Agent大招至简：开源且免费，百万上下文、多模态、MCP全支持

百度文心快码AI IDE上线，首创设计稿一键转代码、支持MCP

老黄新鲜一刀，RTX 5050正式官宣

国产GPU历史性时刻！摩尔线程、沐曦同日获IPO受理

00后投身具身智能创业，剑指机器人界「Model 3」！已推出21个自由度灵巧手

监督学习也能从错误中学习反思？！清华英伟达联合提出隐式负向策略爆炸提升数学能力

AI也会闹情绪了！Gemini代码调试不成功直接摆烂，马斯克都来围观

百度文心快码AI IDE上线，首创设计稿一键转代码、支持MCP

曝苹果拟收购Perplexity AI，人才一并拿走