清华新闻网10月24日电 近日,清华大学脑与智能实验室与北京大学前沿交叉学科研究院组成的国际科学家团队开发了一种新的计算方法,可以利用单细胞转录组数据重构细胞的空间组织。研究表明,这种名为De Novo Coalescent Embedding(D-CE)的方法在将单个细胞映射回组织内的原始位置方面优于现有技术。
单细胞转录组(scRNA-seq)技术可以描绘单个细胞中的基因表达,但会丢失细胞的空间位置信息。因此,我们需要一种计算方法根据细胞的转录组特征来重建细胞之间的空间关系。此项研究提出的D-CE方法可以从头构建细胞的空间位置映射,而不需要先验知识。
图1. De Novo Coalescent Embedding(D-CE)算法可以利用基因表达信息重构单细胞的三维空间组织。本研究表明直接从基因表达推断单细胞的三维空间组织是可能的。D-CE方法构建转录组网络,并使用聚合嵌入(coalescent embedding)技术将此网络映射到三维空间以重建组织中细胞的位置信息
研究人员首先在具有已知空间标记的基准数据集上测试了D-CE。结果表明它可以准确重构小鼠和人胚胎组织样本中的细胞位置。与以前的方法novoSpaRc和CSOmap相比,D-CE具有最优异的性能,最好地分离了来自不同空间域的细胞。
图2.利用D-CE和现有方法从寡细胞/单细胞转录组数据重构其空间位置信息。a)示意图显示了小鼠胚胎E7.5中的4个空间域pA、dA、pP和dP。b) D-CE、novoSpaRC、CSOmap、PCA、t-SNE和UMAP所获得的OI、ASI和PSImcc评分。这些分数衡量重构的准确性,更高的分数代表更高的准确性。c)利用D-CE、novoSpaRC、CSOmap、PCA、t-SNE和UMAP重构的小鼠胚胎组织空间结构
D-CE的一个关键创新点是其在没有先验知识的情况下也能提取表达特定空间模式的标志基因。研究人员表明,使用这些D-CE确定的标志基因进一步提高了空间重构的准确性。
通过在果蝇和斑马鱼胚胎单细胞转录组数据集上的进一步测试,研究团队表明D-CE方法具有在不同物种上的灵活性和通用性。总体而言,D-CE在14个数据集、近500个重构实验中实现了至少优于现有方法四倍的准确性。
D-CE还通过重建细胞之间的空间关系,揭示了影响组织空间特征形成的新调节因子,如氧气、细胞外基质和紧密连接梯度。参与研究的科学家们指出,D-CE的准确性和通用性将使其成为从单细胞转录组数据的空间模式中获取生物学见解的新工具。
相关成果以“利用转录组网络的从头联合嵌入实现单细胞/寡细胞空间重构”(Spatial Reconstruction of Oligo and Single Cells by De Novo Coalescent Embedding of Transcriptomic Networks)为题,发表在《先进科学》(Advanced Science)期刊上。
该研究获得了中国科学技术部、中国国家自然科学基金和上海市科技重大专项的资助。清华大学脑与智能实验室首席研究员卡洛·维托里奥·坎尼斯特拉希(Carlo Vittorio Cannistracih)教授和北京大学前沿交叉学科研究院韩敬东教授为论文的共同通讯作者。北京大学定量生物学中心博士生赵宇轩和中国科学院上海营养与健康研究所博士生张世强为论文共同第一作者。