米兰-科学家实现多项单细胞多组学分析算法的系统性评估—新闻—科学网

近日,中国科学手艺年夜学生命科学与医学部传授瞿昆课题组、数学科学学院传授陈发来课题组和北京生命科学研究所研究员黎斌课题组合作完成了一项功效。该团队阐发了百万量级单细胞多组学数据,系统评估了14种单细胞模态猜测算法和18种单细胞多组学整合算法的机能。相干研究功效以Benchmarking algorithms for single-cell multi-omics prediction and integration为题,在线颁发在《天然-方式》(Nature Methods)上。

单细胞多组学手艺的成长,为摸索细胞功能和复杂的基因调控机制供给了机缘。但是,湿尝试方式凡是面对着高本钱、数据质量有限和批次效应等挑战。为降服这些局限,生物信息学家基在统计模子和人工智能手艺,开辟了多种算法。这些算法可以或许操纵单细胞转录组数据揣度统一细胞内的卵白质品貌和染色质可和性信息,并经由过程将分歧模态的数据映照到同一的特点空间实现数据整合以去除批次效应。这些东西晋升了现有单细胞数据的解析能力。但是,面临海量数据和浩繁算法,科研人员常常难以判定哪些东西最合适他们的研究工作。是以,对这些算法进行基准测试尤其主要。

该研究搜集了47个数据集的上百万个单细胞多组学数据,涵盖多个生物样本和尝试平台。研究设计了一套周全的评估流程,连系算法的正确性、鲁棒性和计较资本耗损等多维度指标,评估了范畴内的经常使用算法。成果显示,在卵白质品貌猜测方面,totalVI和scArches表示最优良;在染色质可和性猜测中,LS_Lab算法排名领先;在多组学整合阐发中,Seurat、MOJITOO和scAI在垂直整合上表示凸起,而totalVI和UINMF在程度整合和马赛克整合使命中揭示出优良机能。该工作为算法设计供给了新思绪,并为将来多组学数据的阐发和利用奠基了根本。同时,为帮忙科研人员选择适合的阐发东西,该团队在GitHub上发布了完全的阐发流程、代码和测试数据集,以供同业利用和改良。

进一步,科研人员切磋了这些算法的数学道理,发现了降噪处置是提高单细胞数据猜测精度的要害。在机能评估中,机械进修算法和基在几率模子的深度进修算法表示出优势。同时,研究提出,现有模态猜测算法在某些要害卵白的猜测机能上有待晋升,染色质可和性猜测的正确性需要进一步优化。

研究工作获得国度重点研发打算和国度天然科学基金等的帮助,并取得中国科年夜超等计较中间与生命科学学院生物信息学中间的计较资本撑持。

论文链接

评估流程示意图

特殊声明:本文转载仅仅是出在传布信息的需要,其实不意味着代表本网站不雅点或证实其内容的真实性;如其他媒体、网站或小我从本网站转载利用,须保存本网站注明的“来历”,并自大版权等法令责任;作者假如不但愿被转载或联系转载稿费等事宜,请与我们联系。

上一篇:米兰-中外学者发现首个白矮星+超冷亚矮星双星系统—新闻—科学网 下一篇:米兰-多种纠错技术“护驾”量子计算—新闻—科学网