用bedtools统计深度和覆盖度
bedtools 也是一个常驻我环境变量的软件了。
突然有一个需求,是统计任意深度的百分比,一时半会,没想到有什么现成的工具可以用,所以就用bedtools来统计了。
操作很简单,需要的输入文件是一个排过序的bam。
看一下统计原理:
可以看出,当加入参数-d -split的时候,可以得到比较好进行下一步统计的结果。
bedtools genomecov -ibam xxx.sorted.bam -g reference.fa -bga > results.txt
例如:
得到下面这样的结果
chr1 100 101 300
chr1 101 102 311
chr1 102 150 400
chr1 150 155 320
可以看出,当加入的参数是-bga...
bamdst统计测序结果质量值
最近做质控的时候,用了bedtools、samtools、gatk、alfred等软件来统计质量值,但是都没有bamdst的结果来的称心。
看名字应该是国人作品,谢谢这位大佬。
安装
直接走git clone途径或者下载下来解压。
git clone https://github.com/shiquan/bamdst.git
cd bamdst
make
使用
我是用来做目标区域的捕获统计。需要的是比对后的bam文件,以及目标区域的bed文件。
使用的方式是:
bamdst -p region.bed -o ./output in.bam
需要注意的是,这个output文件夹需要自行创建,不然结果还是会直接输出在当前文件夹下。
最后能得到很多文件。我需要的是其中的regi...
samtools是真的好用啊,要灵活使用各种flag和tag
samtools一直以来就是个对于生信很有用的软件,最近做转基因的项目,要疯狂的提取出各种类型的reads,使用samtools view的大F小f,用起来简直不能再爽快。
比方说,bwa比对完会有一些额外比对的reads,就差不多是一个reads除了pair的两条,还会出来第三条同样名字的reads,有时我们需要,有时多了会影响分析。这时用samtools除去
samtools view xxx.bam -F 2048 -bSh -o xxx.rm.bam
然后还有就是,我只想要能pair上的reads
samtools view xxx.bam -F 2060 -bSh -o xxx.pair.bam
这里使用的flag值,在之前也提到过,灵活使用flag值,对bam文件...
SAM/BAM文件
最近是深入的了解了一下BAM/SAM文件。
众所周知,SAM文件是比对后的文件,格式约定俗成,是一些大佬规定出来的格式,而BAM文件是SAM文件的二进制形式,为的是节省空间。
又众所周知,目前最好用的处理BAM文件和SAM文件的软件是samtools。
然后,对于python来说,有一个比较好用的包是pysam,根出同源。但是,pysam貌似和windows不兼容。
对于我这种需要跨平台工作的人来说,又找到了一个包,bamnostic。
SAM,其实是一个tab分割的文件。
SAM文件可以直接用
less test.sam
或者
cat test.sam
来查看。但是对于BAM文件这种二进制的格式,就需要用到samtools。
一般的
samtools view t...
下载ncbi的sra数据v2
以前也写过一篇关于SRA的文章,但是SRA现在更新的连妈都不认得了。所以我也更新一下。
首先还是下载sra工具。
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.4/sratoolkit.2.9.4-ubuntu64.tar.gz
tar -zxvf sratoolkit.2.9.4-ubuntu64.tar.gz
cd sratoolkit.2.9.4-ubuntu64/bin
然后在NCBI SRA中搜索需要的数据。
例如,我搜索transgene,随便挑了一个DNA的数据,像这个:SRX5097736。
然后,点击右上角的Send to,选择File,在下拉页选择Runinfo,点击Create file。这时会下载...
宏基因组,除去宿主序列
偷偷摸摸写成未来的日期,假装天天更新。
需要的软件:
bowtie2
samtools
bedtools
首先,是将序列比到宿主基因组上
# 建索引
bowtie2-build host.fna host
# 比对
bowtie2 -x host \
-1 sample_1.fastq.gz \
-2 sample_2.fastq.gz \
-S sample.sam --threads 16
# 转成bam
samtools view -bS sample.sam > sample.bam
然后,除掉比对上了的
samtools view -b -f 12 -F 256 sample.bam > sample.unmapped.bam
# -f ...
这才是conda的正确姿势
Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。
曾几何时,我一度沉迷conda,因为用conda安装各种软件实在是太方便了。不过,后来是因为conda污染了我的环境,所以被我弃用。现在算是为conda正一下名,因为之前用的姿势不太对。
安装miniconda
做生信并不需要装anaconda,装miniconda就行了。
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
sh Miniconda3-latest-Linux-x86_64.sh
创建环境
这一步很重要!就是最关键的,把每个流程创建一个环境,这样不...
WSL怎么用docker
以前写的docker安装流程
WSL里装了docker,但是运行的时候会报
docker: Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?. See 'docker run --help'.
解决办法:
运行
docker -H localhost:2375 images
可以把这句添加到环境中
export DOCKER_HOST=localhost:2375
but! 这个时候还是不能用的,是因为这还是在windows下,需要装windows的客户端。
对右下角图标右键点setting。...
共计 204 篇文章,26 页。