提取TCGA 中体细胞突变数据的表达矩阵
#因為之前的命令調用GDCquery_Maf 發現用不了
#故找到了一些其他的方法,并且自己試著將其弄成了一個表達矩陣。
#代碼如下
#1、下載加載相應的包
install.packages("pacman")
library(pacman)
p_load(TCGAbiolinks,DT,tidyverse)
BiocManager::install("TCGAbiolinks")
library(TCGAbiolinks)
library(tidyverse)
BiocManager::install("maftools")
library(maftools)
library(dplyr)
#
TCGAbiolinks:::getProjectSummary("TCGA-STAD")
#建立查詢
raw<-GDCquery(
? project= "TCGA-STAD",
? data.category = "Simple Nucleotide Variation",
? access = ?"open",
? legacy = FALSE,
? data.type= "Masked Somatic Mutation",
? workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking"
)
#下載數據
GDCdownload(raw)
#獲取數據
maf<- GDCprepare(raw)
#讀取數據
maf<-maf %>% maftools::read.maf()
#表格化數據,數據會以表格形式出現在右下角viewer里
datatable(getSampleSummary(maf),
? ? ? ? ? filter = 'top',
? ? ? ? ? options = list(scrollX = TRUE , keys = TRUE,?
? ? ? ? ? ? ? ? ? ? ? ? ?pageLength = 5),
? ? ? ? ? rownames = FALSE)
#(以上代碼是看b站一個視頻來的,但是我需要這個表格,根據自己需求繪制相應的樣本的TMB瀑布圖,比較兩個組之間的差異情況)
#把突變數據提取成為一個表達矩陣
a<-datatable(getSampleSummary(maf),
? ? ? ? ? ? ?filter = 'top',
? ? ? ? ? ? ?options = list(scrollX = TRUE , keys = TRUE,?
? ? ? ? ? ? ? ? ? ? ? ? ? ? pageLength = 5),
? ? ? ? ? ? ?rownames = FALSE)
#觀察列表a的結構,發現突變數據表達矩陣在a的x中的data中,提取出來。
STADTMB<-a$x$data
View(STADTMB)
?
#這樣就生成了一個和GDCquery_Maf提取出來的合并了的體細胞突變數據了(應該是,自己也沒用GDCquery_Maf 提取出來過。總之可以用來做后續的分析:比如比較TCGA中構建出來的風險模型,高低風險組之間的TMB情況)
總結
以上是生活随笔為你收集整理的提取TCGA 中体细胞突变数据的表达矩阵的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 高通平台WIFI-去掉信号标识上面的叹号
- 下一篇: ISME:华中农大李霞组发现大豆根际微生