蜜汁问题?差异基因分析谁比谁有差别吗?
做差異基因分析時經(jīng)常會遇到有老師糾結(jié)是樣品組A比樣品組B還是樣品組B比樣品組A。每次我都是很詫異,這有區(qū)別嗎?
這是一個典型的DESeq2輸出結(jié)果,我們怎么知道他計算的是trt/untrt還是untrt/trt?
ID trt untrt baseMean log2FoldChange pvalue padj ENSG00000152583 1885.248 80.835 983.042 4.546 1.219e-91 2.149e-87 ENSG00000189221 4366.392 416.725 2391.559 3.387 9.955e-61 8.779e-57 ENSG00000179094 1353.139 161.359 757.249 3.065 2.435e-54 1.432e-50 ENSG00000116584 1450.876 3033.977 2242.427 -1.064 3.957e-49 1.745e-45選2個基因做個例子就可以,ENSG00000152583的log2FoldChange是正值,這個基因在trt樣本組表達高;ENSG00000116584的log2FoldChange是負值,這個基因在untrt樣本組表達高;結(jié)果很明顯了,是trt/untrt。log2FoldChange為正時表示基因在處理后上調(diào),為負時表示基因在處理后下調(diào)。
如果反過來,如下(給log2FoldChange列都乘以了-1),log2FoldChange為正時表示基因在處理后下調(diào),為負時表示基因在處理后上調(diào)。
ID trt untrt baseMean log2FoldChange pvalue padj ENSG00000152583 1885.248 80.835 983.042 -4.546 1.219e-91 2.149e-87 ENSG00000189221 4366.392 416.725 2391.559 -3.387 9.955e-61 8.779e-57 ENSG00000179094 1353.139 161.359 757.249 -3.065 2.435e-54 1.432e-50 ENSG00000116584 1450.876 3033.977 2242.427 1.064 3.957e-49 1.745e-45其實就是描述方式不同。你可以在差異基因分析之前制定以哪個組做參考;如果沒有指定或忘記了指定,結(jié)果正好又是反過來的,直接對log2FoldChange取反就可以。
另外還有一個問題,在之前幾期課程也是常常被問起,log2 Fold change (有時簡寫為log2FC)是什么?初次不知道這個單詞的含義沒問題,如果不知道差異倍數(shù)就有點不好理解了。
首先看Fold change是什么?是差異倍數(shù)。怎么算的呢?正常計算是兩個組的平均值的商,具體到上面的例子就是trt/untrt,如ENSG00000152583的fold change是1885.248/80.835=23.32217。
為什么會取log2呢?我們看下下面這張圖。所有算出的小于0的Fold change轉(zhuǎn)為了負數(shù),大于0的Fold change還是正數(shù)。且上調(diào)兩倍可轉(zhuǎn)為log2FC=1,下調(diào)兩倍可轉(zhuǎn)為log2FC=-1,轉(zhuǎn)換后的值上下調(diào)存在對稱關(guān)系,更有利于查看、篩選和繪圖。如常用篩選標準abs(log2FC)>=1可以獲得差異倍數(shù)2倍的上下調(diào)基因 (log(2)==1; log(0.5)=-1)。
fc=c(seq(0.25,1,length.out=4), seq(1,4,length.out=4))data = data.frame(fc=fc, log2fc=abs(log2(fc)))data$sign = ifelse(data$fc<1,'neg','pos')data# devtools::install_git("https://gitee.com/ct5869/ImageGP") library(ImageGP) sp_scatterplot(data, xvariable = "fc", yvariable = "log2fc", color_variable = "sign", manual_color_vector = c("red","blue"))當(dāng)然我們算出的log2FC跟DESeq2給出的不完全一致,是因為DESEq2做了進一步校正,但通常差別不大。
往期精品(點擊圖片直達文字對應(yīng)教程)
機器學(xué)習(xí)
后臺回復(fù)“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的蜜汁问题?差异基因分析谁比谁有差别吗?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 色深
- 下一篇: Win7+Ubuntu双系统启动项修复总