術語解釋:Cox回歸:又稱比例風險回歸模型(proportionalhazardsmodel,簡稱Cox模型),是由英國統(tǒng)計學家。該模型以生存結局和生存時間為應變量,可同時分析多種因素對于生存期長短的影響。Cox模型能分析帶有截尾生存時間的資料,且不要求估計資料的生存分布類型,因此在醫(yī)學界被***使用。Logistic回歸:又稱邏輯回歸模型,屬于廣義線性模型。邏輯回歸是一種用于解決二分類問題的分析方法,用于估計某種事物的可能性。相較于傳統(tǒng)線性模型,邏輯回歸模型以概率形式輸出結果,可控性高且結果可解釋性強。數(shù)據(jù)要求:樣本臨床信息或生物學特征(基因突變、基因表達等)樣本的隨訪數(shù)據(jù)(總生存期,生存狀態(tài))或樣本的分組情況下游分析:1.補充相關因素的已有相關研究2.解釋相關因素對研究課題的意義。 蛋白組代謝組個性化分析。遼寧算法還原與開發(fā)數(shù)據(jù)科學口碑推薦
Inmmune gene
免疫學研究是目前科研領域爭相研究的熱點,**免疫細胞浸潤是其中一種。**免疫細胞浸潤是指免疫細胞從血液中移向**組織發(fā)揮作用。我們從**組織中分離出浸潤免疫細胞含量,計算基因與浸潤免疫細胞含量的相關性,篩選出影響免疫浸潤的候選基因。
基本原理:
從基因矩陣數(shù)據(jù)中提取免疫細胞含量,生成免疫細胞含量矩陣;
計算目標基因與浸潤免疫細胞含量的相關性,篩選與浸潤免疫細胞含量高度相關的基因。
術語解讀:
相關性系數(shù)(pearson,spearman, kendall)反應兩個變量之間變化趨勢的方向以及程度。相關系數(shù)范圍為-1到+1。0表示兩個變量不相關,正值表示正相關,負值表示負相關,值越大表示相關性越強。
數(shù)據(jù)要求:
**數(shù)據(jù)表達矩陣 遼寧算法還原與開發(fā)數(shù)據(jù)科學口碑推薦基因組數(shù)據(jù)全鏈條處理。
GeneBodyProfile(對比不同的樣品在某一區(qū)域的信號特征,不**于ChIP-seq、DNase-seq、ATAC-seq數(shù)據(jù)):GeneBodyProfile表觀遺傳修飾和對基因表達、細胞發(fā)育等過程有著深遠的影響,但相關的研究還未完善。通過對比不同的樣品在某一區(qū)域的信號特征,了解不同情況下該基因的表觀遺傳情況,幫助更好的了解其發(fā)***展過程。一般應用場景:觀察相關基因轉錄起始位點(TSS)、轉錄終止位點(TTS)、genebody以及兩側信號特征;觀察某一功能區(qū)域(CpGi、TSS、TTS、peaksummits或enhancer區(qū))及其兩側信號特征。數(shù)據(jù)要求:ChIP-seq、DNase-seq或ATAC-seq數(shù)據(jù)。下游分析:基于展示的基因或功能情況1.補充展示部分的已有相關研究2.解釋展示部分對研究課題的意義。
survivalCurve生存分析生存分析(survivalCurve)旨在更好地分析對不同因素對患者預后的影響,從而找到影響患者疾病的關鍵因素。生存曲線(Kaplan-Meier曲線)是生存分析的基本步驟,展示分類樣本的生存曲線,從而揭示不同因素對疾病預后的影響。一般可應用的研究方向有:患者的生存期跟基因變異的關系、藥物處理導致模式動物生存期變化。基本原理Kaplan-Meier法,直接用概率乘法定理估計生存率,故稱乘積極限法(product-limitmethod),是一種非參數(shù)法。相比其他方法,KM曲線能更好的處理刪失數(shù)據(jù)。先將樣本生存時間從小到大排列。若遇到非刪失值和刪失值相同時,非截刪失排在前面。在生存時間后列出與時間相應的死亡人數(shù),期初病例數(shù)(即生存期為某時間時尚存活的病例數(shù))。然后計算活過每個時間點的生存率。以生存時間為橫坐標,生存率為縱坐標所作的曲線,即為Kaplan-Meier曲線。術語解釋風險比(HazardRatio,HR):Kaplan-Meier方法中計算的風險比HR為兩分組對生存期影響的比例,用來描述該基因高表達對生存期的危險程度。該方法中的假設檢驗為兩組中樣本的生存期是否存在差異,即該因素是否會導致生存期的改變。刪失(censored):在生存分析中。 指導科研方案糾偏,更好更快發(fā)表文章。
術語解讀:中位數(shù)Q2:二分之一分位數(shù)上四分位數(shù)Q1:序列由小到大排序后第(n+1)/4所在位置的數(shù)值下四分位數(shù)Q3:序列由小到大排序后第3(n+1)/4所在位置的數(shù)值**值:非異常范圍內(nèi)的**值,四分位距IQR=Q3-Q1,上限=Q3+最小值:非異常范圍內(nèi)的最小值,下限=數(shù)據(jù)要求:某一基因在各**及對應的正常組織的表達數(shù)據(jù)。應用示例1:(于2014年2月發(fā)表于Nature.,影響因子)文章研究了12種主要**類型的突變景觀和意義,它首先使用小提琴圖展示了12種**的突變頻率分布情況,然后查找確定具有***意義的突變基因。應用示例2:(于2017年1月發(fā)表在NatCommun.,影響因子)文章研究了Pancancer建模預測體細胞突變對轉錄程序背景的特異性影響。研究人員基于開發(fā)的模型預測重要轉錄因子,然后使用預測出的突變轉錄因子的活性情況繪制泛*圖譜。 構建新的臨床預測模型。遼寧算法還原與開發(fā)數(shù)據(jù)科學口碑推薦
在基因組上同時展示突變位點和motif,為突變影響轉錄因子結合提供量化和可視化的證據(jù)。遼寧算法還原與開發(fā)數(shù)據(jù)科學口碑推薦
RNAseqChIP根據(jù)RNA-seq表達譜分析得到的結果,繪制對應基因啟動子區(qū)的ChIP-seq信號,觀察轉錄因子對基因的調(diào)控影響。一般可應用場景:測了RNA-seq和ChIP-seq,結合轉錄因子結合情況分析基因表達;只測了RNA-seq,補充相關ChIP-seq公共數(shù)據(jù)。基本原理:染色質免疫共沉淀技術(ChromatinImmunoprecipitation,ChIP)也稱結合位點分析法,是一種研究蛋白質與染色質結合情況的方法。將ChIP與第二代測序技術相結合的ChIP-Seq,能夠高效地在全基因組范圍內(nèi)檢測與組蛋白、轉錄因子等互作的DNA區(qū)段。轉錄組測序RNA-seq,獲取的轉錄組基因表達情況,結合ChIP-seq數(shù)據(jù),可以從更宏觀的角度分析轉錄因子調(diào)控的對基因表達的影響。數(shù)據(jù)要求:基因列表,ChIP-seq數(shù)據(jù)。 遼寧算法還原與開發(fā)數(shù)據(jù)科學口碑推薦