熊珍珍,张本龚.基于负二项分布的单细胞数据缺失值分治插补研究[J].纺织大学学报,2023,36(1): |
基于负二项分布的单细胞数据缺失值分治插补研究 |
|
|
DOI: |
中文关键词: 单细胞转录组测序 数据缺失 插补策略 聚类分析 |
英文关键词: |
基金项目: |
|
摘要点击次数: 715 |
全文下载次数: 764 |
中文摘要: |
摘 要:单细胞转录组测序(scRNA-seq,single cell RNA sequencing)技术为单个细胞高通量、高分辨率的
深入研究提供了机会,为在单细胞层面研究细胞功能及其背后的基因调控机制提供了重要技术手段。然而这项
技术也带来新的挑战,单细胞数据具有规模大、噪声高、异构性强等特点,特别是高比例的数据缺失(dropout)
严重影响了下游分析的可靠性,甚至掩盖了基因与基因间的重要关系。这里提出一种基于负二项分布的分治插
补策略 ND-Impute(Negative binomial distribution based Divide and conquer strategy for imputation)对
scRNA-seq 数据进行处理,该方法假设 scRNA-seq 数据符合负二项分布,利用包含特定损失函数的自动编码器
获取数据的特异性参数,并使用分治策略估计潜在的基因表达值。通过聚类效果、相关性和误差分析等比较,
表明该方法可以有效地恢复缺失数据,提高了后续研究分析的准确性。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |