生物信息之Seurat的安裝與使用(basecalling生物信息)
爾云間 一個(gè)專門(mén)做科研的團(tuán)隊(duì)
原創(chuàng) 小果 生信果
歡迎點(diǎn)贊 收藏 關(guān)注[給你小心心]
什么是Seurat?
Seurat是R語(yǔ)言中被用于單細(xì)胞RNA-seq質(zhì)控、分析的一個(gè)r包。從而時(shí)用戶可以鑒定來(lái)自單細(xì)胞轉(zhuǎn)錄本測(cè)定的異質(zhì)性來(lái)源。
其中,Seurat包的應(yīng)用主要包含了:數(shù)據(jù)導(dǎo)入、數(shù)據(jù)過(guò)濾、數(shù)據(jù)歸一化、特征選擇、數(shù)據(jù)縮放、數(shù)據(jù)降維、聚類、數(shù)據(jù)可視化以及差異表達(dá)基因分析的功能。
本文主要講解Seurat包的安裝以及其簡(jiǎn)單的應(yīng)用,包括數(shù)據(jù)導(dǎo)入、數(shù)據(jù)過(guò)濾、數(shù)據(jù)特征可視化。
Seurat的安裝
安裝命令
> install.packages('Seurat')
注意:目前Seurat最高版本是3.0版本,需要適配的R的版本在3.4及以上,如果你的R版本在3.4以上,即可直接在R中安裝。
安裝成功后引用R包可能會(huì)出現(xiàn)的錯(cuò)誤
此時(shí),我們需要再安裝spatstat.data這個(gè)包:
> install.packages('spatstat.data')
當(dāng)安裝spatstat.data包時(shí),可能還會(huì)出現(xiàn)spatstat.utils和spatstat.data版本不適配的問(wèn)題,導(dǎo)致spatstat.data無(wú)法正確被安裝。
安裝時(shí)報(bào)錯(cuò)信息:
Error: package or namespace load failed for ‘Seurat’ in loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]):
載入了名字空間‘spatstat.utils’ 3.0-1,但需要的是>= 3.0.2
此時(shí),我們需要重新下載對(duì)應(yīng)版本的spatstat.utils,并在下載之前刪除原來(lái)版本的spatstat.utils。
>remove.packages("spatstat.utils")
刪除原來(lái)版本的r包后,我們需要首先去下載好對(duì)應(yīng)R包的壓縮包,這里需要特別注意的是,下載好的必須是.tar,而不能是.zip。這里貼下我下載的鏈接:
https://mirrors.sjtug.sjtu.edu.cn/cran/web/packages/spatstat.utils/index.html
下載好后,運(yùn)行以下命令:
>install.packages("C:/下載/spatstat.utils_3.0-1.tar.gz", repos = NULL, type = "source")
(第一個(gè)空就填寫(xiě)你下載好的壓縮包所在的絕對(duì)路徑即可)
如果你成功安裝了Rtools并且和R以及RStudio在同一目錄下,即可成功安裝,如果這一步仍然報(bào)錯(cuò),那么你需要檢查以下是否正確安裝了Rtools,同時(shí)也要注意R和RStudio的版本對(duì)應(yīng)問(wèn)題哦~
以上問(wèn)題解決后,當(dāng)我們?cè)赗中引用Seurat包就不會(huì)報(bào)錯(cuò)了!
Seurat包的簡(jiǎn)單使用
經(jīng)過(guò)一番周折,我們成功安裝了Seurat包。接下來(lái)我們要學(xué)習(xí)怎樣使用Seurat包。
導(dǎo)入數(shù)據(jù)/創(chuàng)建Seurat對(duì)象
>library(dplyr)>library(Seurat)#導(dǎo)入pbmc數(shù)據(jù)>pbmc.data <- Read10X(data.dir="Rdata/filtered_gene_bc_matrices/hg19/")>pbmc <- CreateSeuratObject(counts = pbmc.data, project = "pbmc3k" , min.cells = 3,min.features = 200)>pbmc
提示信息告訴我們,生成的pbmc對(duì)象中有13714個(gè)基因,2700個(gè)細(xì)胞。
導(dǎo)入成功后,我們也可以在Rstudio中查看pbmc對(duì)象的整體結(jié)構(gòu)如下:
數(shù)據(jù)過(guò)濾/質(zhì)量控制
下面,我們以人的數(shù)據(jù)為例,以MT-開(kāi)頭的所有基因集座位線粒體基因集,利用小提琴圖可視化質(zhì)控指標(biāo)(過(guò)濾條件:過(guò)濾線粒體基因占比大于5%的細(xì)胞、過(guò)濾UMI數(shù)大于2500或小于200的細(xì)胞)。
>pbmc[["percent.mt"]]<-PercentageFeatureSet(pbmc,pattern = "^MT-")>VlnPlot(pbmc,features = c("nFeature_RNA","nCount_RNA","percent.mt"),ncol = 3)>pbmc<-subset(pbmc,subset=nFeature_RNA>20 & nFeature_RNA <2500 & percent.mt<5)>head(pbmc@meta.data, 5)
特征-特征之間關(guān)系可視化
接下來(lái),我們可以用FeatureScatter函數(shù)可書(shū)畫(huà)特征與特征之間的關(guān)系。
>plot3 <- FeatureScatter(pbmc,feature1 = "nCount_RNA",feature2 = "percent.mt")>CombinePlots(plots= list(plot3))
以上,就是我們對(duì)Seurat包的安裝與基本使用方法的總結(jié),不知道有沒(méi)有幫助到你呢~
“生信果”,生信入門(mén)、R語(yǔ)言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識(shí)技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見(jiàn)證小白和大佬的成長(zhǎng)。