主页

用edgeR做差异分析

目前主流的差异分析流程,用的基本都是DESeq2或者edgeR。DESeq2之前说过了。这次来写edgeR。 首先在R中安装 source("https://bioconductor.org/biocLite.R") biocLite("edgeR") # 跑的时候提醒我少了个statmod,一起装上 install.packages("statmod") 然后,这次依然是用featureCounts的结果来跑。 可以查看上次的文章。 拿到了all_feature.txt这个结果之后,就可以用在R里面跑了。 library(edgeR) library(statmod) # 设置样本的名字 sampleNames <- c("siCtrl_1", "siCtrl_2",...

阅读更多

又一个QC软件,qualimap

这是官网:qualimap 这个软件就像fastqc那样,又做了命令行,又做了GUI界面。总体让我感觉非常好。 首先来下载安装。 wget https://bitbucket.org/kokonech/qualimap/downloads/qualimap_v.2.12.zip unzip qualimap_v.2.12.zip cd qualimap_v.2.12 ./qualimap -h 然后它可以用来统计比对之后的bam文件的数据质量,连深度覆盖度这些都可以统计。 这一点,fastqc是做不到的。 想统计fastqc还可以用samtools。不过我觉得用qualimap比较友好。连图都画好了呀! # 主要的命令就是这样,会在同一个bam文件的文件夹下生成统计结果 qua...

阅读更多

扩增子(3):qiime2

感觉上如果做扩增子的东西始终要懂怎么用qiime2。。。 qiime2把每一步的文件都封装成qza文件,然后画出来的图都封装成qzv文件。 qzv文件要到qiime view上面看。 真香警告! 之前说过怎么安装了。 启动! docker run --rm -v $(pwd):/data --name=qiime -it qiime2/core:2018.6 导入数据 qiime tools import \ --type 'SampleData[PairedEndSequencesWithQuality]' \ --input-path sample.list \ --output-path /data/Qza/paired-end-demux.qza \ --so...

阅读更多

annovar的官方clinvar数据库格式修改教程

刚刚才发现annovar在7月8日的时候放出了官方是怎么把clinvar转换成annovar格式的流程。 首先点击这里下载脚本! 这个脚本其实之前也能下,是用来转换cosmic数据库的。 然后安装小工具包VT git clone https://github.com/atks/vt.git cd vt make ./vt -h 开始测试。 首先去clinvar下载最新的数据库。 wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20180701.vcf.gz wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20180701.v...

阅读更多

扩增子(2):phyloseq画图

phyloseq是一个很好的用来对扩增子流程处理处理的OTU等数据,进行后续分析画图的包。 支持的上游软件包括了DADA2, UPARSE, QIIME, mothur, BIOM, PyroTagger, RDP。 首先在R中安装。 source("https://bioconductor.org/biocLite.R") biocLite("phyloseq") 回过头来,上次说到的DADA2处理的数据。 实际上,其中的seqtab.nochim就是后续需要的otumat也就是OTU表格。 而taxa则是taxmat也就是taxa表格。 这些在phyloseq的文档里说的比较清晰。 上图就是一个otu表格。 每个otu是一段特征序列,如果是在16S中,就是16S序列。然...

阅读更多

扩增子(1):DADA2流程

DADA2是一个通过错误率模型,衡量扩增子序列是否来自模板的算法。 和通过查找样品中物种的组成,比较OTU数据库的聚类算法不同,DADA2采取的是降噪算法。 然后作者还发了文章说明降噪算法比聚类算法要好。PMID 28731476 基于技术向前走的原因,先不去研究OTU方法了。直接来DADA2。 DADA2是一个R包,直接在R中安装。 source("https://bioconductor.org/biocLite.R") biocLite("dada2") 下载一批测试数据,按照教程来,下载mothur的测试数据。 我把数据解压进了Rawdata文件夹。 然后开始使用dada2进行分析。 一、读入文件 library(dada2) # 指定文件夹位置 path <- ...

阅读更多