应用自编码器插补分析提高猪早期胚胎单细胞转录组分析的精度

【目的】深度学习方法能够从大量数据中识别出有用的特征的特性适用于高维和稀疏的单细胞转录组数据中,已被广泛应用于细胞分型,拟时序构建和发育轨迹分析。自编码器作为一种深度学习算法,在单细胞转录组数据降维和插补分析上,有着独特优势。本研究旨在评LXH254分子量估自编码器AutoClass应用在猪早期胚胎单细胞转录组数据中的可行性,以及探究不同胚胎激活方式对关键基因和信号传导通路的影响。【方法】本研究收集了3种不同激活方式(体内受精、体外授精和孤雌)的猪早期胚胎单细胞转录组数据,采用AutoClass进行数selleck化学据质控和插补分析,结合下游分析评估AutoClass性能。此外,通过差异表达基因(Differential expression genes, DEGs)和功能富集分析,深入比较了3种类型胚胎的关键基因和信号通路。【结果】经过数据质控和自编码器数据插补,聚类分析精度提高,不同激活方式的早期胚胎聚类清晰。单独质控只筛选出1287个DEGs,而自编码器插补后,DEperiprosthetic infectionGs数目增加至11523个。功能富集分析进一步挖掘出3种不同类型胚胎间显著差异的关键生物学过程和信号通路,如体内受精胚胎的基础生物学过程和细胞代谢;体外授精胚胎的性腺发育和性别决定;以及孤雌生殖胚胎的免疫防御和分泌途径调节。【结论】本研究采取自编码器提高单细胞转录组数据的分析精度,揭示了3种胚胎激活方式影响早期胚胎发育的关键基因和信号通路,为深入研究猪早期胚胎发育的分子机制提供了新见解和新思路。