主页

用bedtools统计深度和覆盖度

bedtools 也是一个常驻我环境变量的软件了。 突然有一个需求,是统计任意深度的百分比,一时半会,没想到有什么现成的工具可以用,所以就用bedtools来统计了。 操作很简单,需要的输入文件是一个排过序的bam。 看一下统计原理: 可以看出,当加入参数-d -split的时候,可以得到比较好进行下一步统计的结果。 bedtools genomecov -ibam xxx.sorted.bam -g reference.fa -bga > results.txt 例如: 得到下面这样的结果 chr1 100 101 300 chr1 101 102 311 chr1 102 150 400 chr1 150 155 320 可以看出,当加入的参数是-bga...

阅读更多

bamdst统计测序结果质量值

最近做质控的时候,用了bedtools、samtools、gatk、alfred等软件来统计质量值,但是都没有bamdst的结果来的称心。 看名字应该是国人作品,谢谢这位大佬。 安装 直接走git clone途径或者下载下来解压。 git clone https://github.com/shiquan/bamdst.git cd bamdst make 使用 我是用来做目标区域的捕获统计。需要的是比对后的bam文件,以及目标区域的bed文件。 使用的方式是: bamdst -p region.bed -o ./output in.bam 需要注意的是,这个output文件夹需要自行创建,不然结果还是会直接输出在当前文件夹下。 最后能得到很多文件。我需要的是其中的regi...

阅读更多

samtools是真的好用啊,要灵活使用各种flag和tag

samtools一直以来就是个对于生信很有用的软件,最近做转基因的项目,要疯狂的提取出各种类型的reads,使用samtools view的大F小f,用起来简直不能再爽快。 比方说,bwa比对完会有一些额外比对的reads,就差不多是一个reads除了pair的两条,还会出来第三条同样名字的reads,有时我们需要,有时多了会影响分析。这时用samtools除去 samtools view xxx.bam -F 2048 -bSh -o xxx.rm.bam 然后还有就是,我只想要能pair上的reads samtools view xxx.bam -F 2060 -bSh -o xxx.pair.bam 这里使用的flag值,在之前也提到过,灵活使用flag值,对bam文件...

阅读更多

SAM/BAM文件

最近是深入的了解了一下BAM/SAM文件。 众所周知,SAM文件是比对后的文件,格式约定俗成,是一些大佬规定出来的格式,而BAM文件是SAM文件的二进制形式,为的是节省空间。 又众所周知,目前最好用的处理BAM文件和SAM文件的软件是samtools。 然后,对于python来说,有一个比较好用的包是pysam,根出同源。但是,pysam貌似和windows不兼容。 对于我这种需要跨平台工作的人来说,又找到了一个包,bamnostic。 SAM,其实是一个tab分割的文件。 SAM文件可以直接用 less test.sam 或者 cat test.sam 来查看。但是对于BAM文件这种二进制的格式,就需要用到samtools。 一般的 samtools view t...

阅读更多

下载ncbi的sra数据v2

以前也写过一篇关于SRA的文章,但是SRA现在更新的连妈都不认得了。所以我也更新一下。 首先还是下载sra工具。 wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.4/sratoolkit.2.9.4-ubuntu64.tar.gz tar -zxvf sratoolkit.2.9.4-ubuntu64.tar.gz cd sratoolkit.2.9.4-ubuntu64/bin 然后在NCBI SRA中搜索需要的数据。 例如,我搜索transgene,随便挑了一个DNA的数据,像这个:SRX5097736。 然后,点击右上角的Send to,选择File,在下拉页选择Runinfo,点击Create file。这时会下载...

阅读更多

宏基因组,除去宿主序列

偷偷摸摸写成未来的日期,假装天天更新。 需要的软件: bowtie2 samtools bedtools 首先,是将序列比到宿主基因组上 # 建索引 bowtie2-build host.fna host # 比对 bowtie2 -x host \ -1 sample_1.fastq.gz \ -2 sample_2.fastq.gz \ -S sample.sam --threads 16 # 转成bam samtools view -bS sample.sam > sample.bam 然后,除掉比对上了的 samtools view -b -f 12 -F 256 sample.bam > sample.unmapped.bam # -f ...

阅读更多

这才是conda的正确姿势

Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。 曾几何时,我一度沉迷conda,因为用conda安装各种软件实在是太方便了。不过,后来是因为conda污染了我的环境,所以被我弃用。现在算是为conda正一下名,因为之前用的姿势不太对。 安装miniconda 做生信并不需要装anaconda,装miniconda就行了。 wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh sh Miniconda3-latest-Linux-x86_64.sh 创建环境 这一步很重要!就是最关键的,把每个流程创建一个环境,这样不...

阅读更多

WSL怎么用docker

以前写的docker安装流程 WSL里装了docker,但是运行的时候会报 docker: Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?. See 'docker run --help'. 解决办法: 运行 docker -H localhost:2375 images 可以把这句添加到环境中 export DOCKER_HOST=localhost:2375 but! 这个时候还是不能用的,是因为这还是在windows下,需要装windows的客户端。 对右下角图标右键点setting。...

阅读更多