南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法

1,318次阅读
没有评论

Machine Intelligence Research

过去十年,多模态神经影像技术与基因测序技术取得了长足发展。作为一门跨学科研究,脑影像基因组学能够运用脑影像技术将人类大脑的结构与功能作为表型来评价基因对个体的影响,使得人们可以在脑的宏观结构上以更客观的测量手段理解基因对行为或精神疾病的影响。众所周知,机器学习方法作为基于数据驱动的关联分析强有力工具,能够充分利用生物标志数据内在的结构信息构建模型来分析易感基因与大脑结构或者功能的相关性,从而更好地揭示脑认知行为或者相关疾病的产生机制。南京航空航天大学张道强教授团队首先简要介绍了影像基因组学的研究背景和基本原理,然后回顾了单变量方法在影像基因组学研究中的应用,并对基于多变量机器学习的基因-影像关联的研究思路和建模方法进行了归纳总结,随后分析了联合关联分析和结果预测的方法,最后对影像基因组学的未来研究发展方向进行了讨论和展望。

南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法

 

南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法

图片来自Springer

 

全文下载:

Machine Learning for Brian Imaging Genomics Methods: A Review

Mei-Ling Wang, Wei Shao, Xiao-Ke Hao, Dao-Qiang Zhang

https://link.springer.com/article/10.1007/s11633-022-1361-0

https://www.mi-research.net/en/article/doi/10.1007/s11633-022-1361-0 

 

全文导读

近年来,神经影像学伴随着认知神经科学的发展为人脑工作机制的研究带来了新的活力。同时随着无创式脑成像技术的发展,研究者们希望能够从脑结构和脑功能的层面来研究与情绪加工相关的脑活动影响,从而探索神经系统疾病易感性个体差异的神经基础。其中,常用的相关脑成像包括结构磁共振成像(Structural magnetic resonance imaging, sMRI)、功能磁共振成像(Functional magnetic resonance imaging, fMRI)、弥散张量成像(Diffusion tensor imaging, DTI)、正电子发射断层扫描成像(Positron emission tomography, PET)。与此同时,随着遗传学技术的发展,研究者们可以从更精细的分子水平(例如单核苷酸多态性(Single nucleotide polymorphism, SNP)) 来寻找神经系统疾病和精神疾病相关的遗传标记。

 

作为一门新兴的数据科学,脑影像基因组学能够取得快速发展,很大程度要归因于有价值的影像和基因数据库是面向大众开放的。因为”阿尔茨海默病神经影像计划”(Alzheimer’s Disease Neuroimaging Initiative , ADNI)项目对其科学数据的开放,过去十年中,使用ADNI影像基因组学数据而发表的研究成百上千,许多富有创新性的机器学习方法和生物医学发现得以面世。除了ADNI数据库,还有许多类似的标志性研究产生了包括多维影像和组学模态在内的大数据,供相关研究人员使用。例如,”通过Meta分析增强神经影像遗传学”(Enhancing Neuro Imaging Genetics through Meta-Analysis, ENIGMA)联盟、”费城神经发展队列数据库”(Philadelphia Neurodevelopmental Cohort, PNC)和”帕金森病进展标记物研究项目”(Parkinson’s Progression Markers Initiative, PPMI)。

 

脑影像基因组学主要是运用脑影像技术将脑的结构与功能作为表型来评价基因对个体的影响,探讨基因是如何影响大脑的神经结构和功能,以及由此导致的神经系统病理。研究遗传与大脑结构和功能的相关性,在“基因与脑”之间架起一座看得见的桥梁,可以更好地揭示神经精神疾病的发病机制。脑影像基因组学这种工具同时还可以识别出某种脑疾病的生物学指标或其内表型,为预测和诊断疾病提供了更精确的方法。具体来说,研究者大多考虑将SNP作为关联分析的基因型数据。在内表型数据获取中,研究者大多采用临床上广泛使用的MRI 脑影像数据进行分析:sMRI 作为度量大脑结构组织的成像技术,能够量化分析形态学(如灰质体积) 的异常;fMRI 成像技术能够反映不同脑区的功能连接模式。基于不同模态脑成像技术,目前脑影像基因组学主要关注基因SNP 与脑结构、功能、连接关联分析的相关研究。

 

早期的影像基因组学是单变量成对的统计分析方法,即通过多次检验,发现 SNP 或者基因与复杂疾病或可测的数量性状(Quantitative trait, QT) 的关联性。而全基因组关联研究(Genome-wide association study, GWAS) 正是利用全基因组高通量测序技术,对研究对象的基因组中序列变异进行分型,并利用生物统计学和生物信息学的方法,最终筛选出具有显著性的SNP。自从2005 年 Science 上发表的第一篇有关年龄相关性视网膜黄斑变性(Age-related macular degeneration)GWAS 研究论文以来,该方法也被用在精神疾病的分析上。GWAS 在影像基因组学的研究中发挥了极大的作用,但是也存在一些问题,比如,严格的多重校正,使得许多微小效应的变异无法通过校正水平。其次,GWAS 仅仅能得到遗传变异跟性状之间的单个关联程度,并不能很好地解释其中的复杂机制。

 

近年来, 随着机器学习在学术界和工业界迅速发展,研究者们已经尝试利用这些数据分析工具来解决本领域的一些问题。而在影像基因组学的关联分析中,相对于单变量统计分析,基于多变量的机器学习技术的应用最为广泛,并且已经能够识别与疾病相关的影像和基因生物标记。

 

国际上,一些学者也撰写了影像基因组学的相关方法综述。例如,Medland 等针对使用传统的单变量统计模型处理大规模全基因组-全脑影像关联分析提出了所面临的问题和挑战,回顾了研究者在不同中心数据库的研究成果。Liu 和Calhoun主要对独立成分分析(independent component analysis, ICA) 等其他多变量方法在影像遗传学中的应用进行了归纳和总结。Thompson 等在综述中重点回顾了基因与大脑结构连接与功能网络之间的相关分析工作。本文在以上综述工作的基础上,致力于提供一个全面和最新的脑影像基因组学的机器学习方法综述。

 

图1展示了脑影像基因组学所涵盖相关主题的示意图。基于机器学习的脑影像基因组学方法主要目的是实现关联分析来研究脑疾病的发病机制和发展路径。本文将这些基于机器学习的脑影像基因组学方法分为两类。

 

南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法

图1

 

第一类主要使用回归模型来确定复杂的多-SNP(multi-SNP)与/或多-QT(multi-QT)关联。通常情况下,大多数回归模型可以描述为使用了正则化损失函数框架。在这些模型中经常包含稀疏正则项。其主要动机是:首先,假设只有少数标记物与影像基因组学关联,稀疏项可以帮助识别这些相关标记。其次,稀疏约束可以降低模型的复杂度,从而降低过拟合的风险。

 

除了回归模型,另一个脑影像基因组学研究使用的主要方法是相关模型,例如,稀疏典型相关分析(sparse canonical correlation analysis, SCCA)和并行独立成分分析(parallel-independent component analysis, pICA)回归方法。与刚刚讨论的回归模型相似,值得注意的是,考虑到只有少数标记物与成像遗传学关联,稀疏约束可以降低模型的复杂度,避免过度拟合的风险,以及帮助识别这些相关标记物。

 

总的来说,本文主要关注以下三种类型的学习问题。首先,本文将展示单变量影像遗传学关联分析的局限性,并展示用于相关性分析的单变量学习方法。其次,本文将提出多变量影像遗传关联分析的问题,并总结了基于多变量机器学习的基因-影像关联的研究思路和建模方法。第三,本文将回顾通过整合影像和基因数据来预测感兴趣结果的方法,以及联合关联分析和结果预测的方法。最后,对影像基因组学中尚未解决的问题和未来研究发展方向进行了展望。

 

全文下载:

Machine Learning for Brian Imaging Genomics Methods: A Review

Mei-Ling Wang, Wei Shao, Xiao-Ke Hao, Dao-Qiang Zhang

https://link.springer.com/article/10.1007/s11633-022-1361-0

https://www.mi-research.net/en/article/doi/10.1007/s11633-022-1361-0 

 

【本文作者】

南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法

 

纸刊免费寄送

Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接填写收件地址,编辑部将尽快为您免费寄送纸版全文!

说明:如遇特殊原因无法寄达的,将推迟邮寄时间,咨询电话010-82544737

收件信息登记:

https://www.wjx.cn‍/vm/eIyIAAI.aspx#  

 

关于Machine Intelligence Research

Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选”中国科技期刊卓越行动计划”,已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等数据库收录。

 


好文推荐

乔红院士团队 | 类脑智能机器人:理论分析与系统应用 (机器智能研究MIR)
ETHZ团队 | 一种基于深度梯度学习的高效伪装目标检测方法 (机器智能研究MIR)
AI最前沿 | 类脑智能机器人、联邦学习、视觉-语言预训练、伪装目标检测… (机器智能研究MIR)
Luc Van Gool团队 | 深度学习视角下的视频息肉分割
长时视觉跟踪器: 综述与实验评估 | 机器智能研究MIR
专题综述 | 高效的视觉识别: 最新进展及类脑方法综述
北大黄铁军团队 | 专题综述:视觉信息的神经解码
专题综述 | 迈向脑启发计算机视觉的新范式
专题好文 | 新型类脑去噪内源生成模型: 解决复杂噪音下的手写数字识别问题
Top综述集锦 | 进化计算、知识挖掘、自然语言处理、人脸素描合成、机器人辅助手术…
戴琼海院士团队 | 用以图像去遮挡的基于事件增强的多模态融合混合网络
ETH Zurich重磅综述 | 人脸-素描合成:一个新的挑战
综述:从远程操作到自动机器人辅助显微手术
华南理工詹志辉团队 | 综述: 面向昂贵优化的进化计算
北科大殷绪成团队 | 弱相关知识集成的小样本图像分类
东南大学张敏灵团队 | 基于选择性特征增广的多维分类方法
联想CTO芮勇团队 | 知识挖掘:跨领域的综述
中科院自动化所何晖光团队 | 一种基于RGEC的新型网络
最新好文 | 基于因果推断的可解释对抗防御
复旦邱锡鹏团队 | 综述:自然语言处理中的范式转换
精选综述 | 用于白内障分级/分类的机器学习技术

 


MIR资讯

中科院自动化所主办期刊MIR文字编辑招聘启事
2023年人工智能领域国际学术会议参考列表 | 机器智能研究MIR
MIR专题征稿 | Special Issue on Multi-Modal Representation Learning
恭喜!MIR 2022年度优秀编委
恭喜!MIR 2022年度优秀审稿人
致谢审稿人 | 机器智能研究MIR
2022研究前沿及热点解读  (附完整PDF) | 机器智能研究MIR
双喜!MIR入选”2022中国科技核心期刊”,并被DBLP收录 | 机器智能研究MIR
报喜!MIR入选2022年国际影响力TOP期刊榜单
喜报 | MIR被 ESCI 收录!
喜报 | MIR 被 EI 与 Scopus 数据库收录

南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法

 

 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy