主页 - 生物信息文件夹

悄悄的又水一篇。老实人点击这里。完。

目前主流的差异分析流程，用的基本都是DESeq2或者edgeR。DESeq2之前说过了。这次来写edgeR。首先在R中安装 source("https://bioconductor.org/biocLite.R") biocLite("edgeR") # 跑的时候提醒我少了个statmod，一起装上 install.packages("statmod") 然后，这次依然是用featureCounts的结果来跑。可以查看上次的文章。拿到了all_feature.txt这个结果之后，就可以用在R里面跑了。 library(edgeR) library(statmod) # 设置样本的名字 sampleNames <- c("siCtrl_1", "siCtrl_2",...

悄悄的水一篇。老实人点击这里。完。

这是官网：qualimap 这个软件就像fastqc那样，又做了命令行，又做了GUI界面。总体让我感觉非常好。首先来下载安装。 wget https://bitbucket.org/kokonech/qualimap/downloads/qualimap_v.2.12.zip unzip qualimap_v.2.12.zip cd qualimap_v.2.12 ./qualimap -h 然后它可以用来统计比对之后的bam文件的数据质量，连深度覆盖度这些都可以统计。这一点，fastqc是做不到的。想统计fastqc还可以用samtools。不过我觉得用qualimap比较友好。连图都画好了呀！ # 主要的命令就是这样，会在同一个bam文件的文件夹下生成统计结果 qua...

感觉上如果做扩增子的东西始终要懂怎么用qiime2。。。 qiime2把每一步的文件都封装成qza文件，然后画出来的图都封装成qzv文件。 qzv文件要到qiime view上面看。真香警告！之前说过怎么安装了。启动！ docker run --rm -v $(pwd):/data --name=qiime -it qiime2/core:2018.6 导入数据 qiime tools import \ --type 'SampleData[PairedEndSequencesWithQuality]' \ --input-path sample.list \ --output-path /data/Qza/paired-end-demux.qza \ --so...

刚刚才发现annovar在7月8日的时候放出了官方是怎么把clinvar转换成annovar格式的流程。首先点击这里下载脚本! 这个脚本其实之前也能下，是用来转换cosmic数据库的。然后安装小工具包VT git clone https://github.com/atks/vt.git cd vt make ./vt -h 开始测试。首先去clinvar下载最新的数据库。 wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20180701.vcf.gz wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/clinvar_20180701.v...

phyloseq是一个很好的用来对扩增子流程处理处理的OTU等数据，进行后续分析画图的包。支持的上游软件包括了DADA2, UPARSE, QIIME, mothur, BIOM, PyroTagger, RDP。首先在R中安装。 source("https://bioconductor.org/biocLite.R") biocLite("phyloseq") 回过头来，上次说到的DADA2处理的数据。实际上，其中的seqtab.nochim就是后续需要的otumat也就是OTU表格。而taxa则是taxmat也就是taxa表格。这些在phyloseq的文档里说的比较清晰。上图就是一个otu表格。每个otu是一段特征序列，如果是在16S中，就是16S序列。然...

DADA2是一个通过错误率模型，衡量扩增子序列是否来自模板的算法。和通过查找样品中物种的组成，比较OTU数据库的聚类算法不同，DADA2采取的是降噪算法。然后作者还发了文章说明降噪算法比聚类算法要好。PMID 28731476 基于技术向前走的原因，先不去研究OTU方法了。直接来DADA2。 DADA2是一个R包，直接在R中安装。 source("https://bioconductor.org/biocLite.R") biocLite("dada2") 下载一批测试数据，按照教程来，下载mothur的测试数据。我把数据解压进了Rawdata文件夹。然后开始使用dada2进行分析。一、读入文件 library(dada2) # 指定文件夹位置 path <- ...

主页

RNA-seq报告简单模板

用edgeR做差异分析

外显子报告简单模板

又一个QC软件，qualimap

扩增子(3)：qiime2

annovar的官方clinvar数据库格式修改教程

扩增子(2)：phyloseq画图

扩增子(1)：DADA2流程