用edgeR做差异分析
目前主流的差异分析流程,用的基本都是DESeq2或者edgeR。DESeq2之前说过了。这次来写edgeR。
首先在R中安装
source("https://bioconductor.org/biocLite.R")
biocLite("edgeR")
# 跑的时候提醒我少了个statmod,一起装上
install.packages("statmod")
然后,这次依然是用featureCounts的结果来跑。
可以查看上次的文章。
拿到了all_feature.txt这个结果之后,就可以用在R里面跑了。
library(edgeR)
library(statmod)
# 设置样本的名字
sampleNames <- c("siCtrl_1", "siCtrl_2",...
又一个QC软件,qualimap
这是官网:qualimap
这个软件就像fastqc那样,又做了命令行,又做了GUI界面。总体让我感觉非常好。
首先来下载安装。
wget https://bitbucket.org/kokonech/qualimap/downloads/qualimap_v.2.12.zip
unzip qualimap_v.2.12.zip
cd qualimap_v.2.12
./qualimap -h
然后它可以用来统计比对之后的bam文件的数据质量,连深度覆盖度这些都可以统计。
这一点,fastqc是做不到的。
想统计fastqc还可以用samtools。不过我觉得用qualimap比较友好。连图都画好了呀!
# 主要的命令就是这样,会在同一个bam文件的文件夹下生成统计结果
qua...
扩增子(3):qiime2
感觉上如果做扩增子的东西始终要懂怎么用qiime2。。。
qiime2把每一步的文件都封装成qza文件,然后画出来的图都封装成qzv文件。
qzv文件要到qiime view上面看。
真香警告!
之前说过怎么安装了。
启动!
docker run --rm -v $(pwd):/data --name=qiime -it qiime2/core:2018.6
导入数据
qiime tools import \
--type 'SampleData[PairedEndSequencesWithQuality]' \
--input-path sample.list \
--output-path /data/Qza/paired-end-demux.qza \
--so...
annovar的官方clinvar数据库格式修改教程
刚刚才发现annovar在7月8日的时候放出了官方是怎么把clinvar转换成annovar格式的流程。
首先点击这里下载脚本!
这个脚本其实之前也能下,是用来转换cosmic数据库的。
然后安装小工具包VT
git clone https://github.com/atks/vt.git
cd vt
make
./vt -h
开始测试。
首先去clinvar下载最新的数据库。
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20180701.vcf.gz
wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20180701.v...
扩增子(2):phyloseq画图
phyloseq是一个很好的用来对扩增子流程处理处理的OTU等数据,进行后续分析画图的包。
支持的上游软件包括了DADA2, UPARSE, QIIME, mothur, BIOM, PyroTagger, RDP。
首先在R中安装。
source("https://bioconductor.org/biocLite.R")
biocLite("phyloseq")
回过头来,上次说到的DADA2处理的数据。
实际上,其中的seqtab.nochim就是后续需要的otumat也就是OTU表格。
而taxa则是taxmat也就是taxa表格。
这些在phyloseq的文档里说的比较清晰。
上图就是一个otu表格。
每个otu是一段特征序列,如果是在16S中,就是16S序列。然...
扩增子(1):DADA2流程
DADA2是一个通过错误率模型,衡量扩增子序列是否来自模板的算法。
和通过查找样品中物种的组成,比较OTU数据库的聚类算法不同,DADA2采取的是降噪算法。
然后作者还发了文章说明降噪算法比聚类算法要好。PMID 28731476
基于技术向前走的原因,先不去研究OTU方法了。直接来DADA2。
DADA2是一个R包,直接在R中安装。
source("https://bioconductor.org/biocLite.R")
biocLite("dada2")
下载一批测试数据,按照教程来,下载mothur的测试数据。
我把数据解压进了Rawdata文件夹。
然后开始使用dada2进行分析。
一、读入文件
library(dada2)
# 指定文件夹位置
path <- ...
共计 204 篇文章,26 页。