多階段單細(xì)胞轉(zhuǎn)錄數(shù)據(jù)的基因識別統(tǒng)計方法問世
近日,西安交通大學(xué)公共衛(wèi)生學(xué)院孫世權(quán)教授團(tuán)隊開發(fā)了一種高效靈活的非參數(shù)方法,用于檢測多個時間點上的基因表達(dá)模式。該方法稱為TDEseq,即時間序列scRNA-seq數(shù)據(jù)的時間差異表達(dá)基因,近日該成果發(fā)表于《基因組生物學(xué)》上。
TDEseq采用線性可加混合模型(LAMM)來擬合單個基因表達(dá)值和時間點的關(guān)系,通過引入形狀約束的樣條函數(shù)表征基因表達(dá)水平的時間序列動態(tài)變化過程檢測具有特定表達(dá)模式的時間動態(tài)差異基因,引入隨機效應(yīng)項以控制樣本間的異質(zhì)性,并最終產(chǎn)生統(tǒng)計學(xué)上嚴(yán)格的p值。TDEseq不僅保證了更高的檢驗效力,也實現(xiàn)了更好的對錯誤發(fā)現(xiàn)率的控制,尤其是在處理樣本異質(zhì)性強的多樣本scRNA-seq數(shù)據(jù)時。
TDEseq在癌細(xì)胞系藥物響應(yīng)、小鼠肝臟胚胎發(fā)育、肺腺癌進(jìn)展過程、NK細(xì)胞相應(yīng)SARS-CoV-2病毒感染等時間序列scRNA-seq數(shù)據(jù)中均展現(xiàn)出良好的性能。以小鼠肝臟胚胎發(fā)育為例,TDEseq識別的動態(tài)差異表達(dá)基因比tradeSeq多20%。TDEseq所識別的動態(tài)差異表達(dá)基因不僅具有明確的時間動態(tài)表達(dá)模式,且與肝臟胚胎發(fā)育過程呈強相關(guān)性。
相關(guān)論文信息:https://doi.org/10.1186/s13059-024-03237-3