GATK流程
不管啦,先放点代码上来,我真的在慢慢整理。
#!/usr/bin/bash
# 20171114
# FastQC查看质量
# 低质量数据过滤1
# -f 保留开始碱基个数,默认1;-l 保留结尾碱基个数,默认1
# -z 输出为gz
# fastx_trimmer -h -f -l -z -i test.fastq -o testQC
# 低质量数据过滤2
# -q 设置最小quality;-p 设置要保留的最少碱基百分比
# -z 输出为gz;-v 输出最终碱基个数
# fastq_quality_filter -h -q 30 -p 90 -z -i testQC -o finalQC -v
# 比对到参考基因组
# 生成sam文件
bwa index ucsc.hg1...
生信懂得简单的linux就可以啦(4)
又来更新这个系列了。
自从弄了一个VPS,我觉得我的linux技能突飞猛进。所以说一定要多上机实操!
这次说三个命令:cut/paste/join
cut
# cut顾名思义就是cut出一段,单纯的cut file是不行的,因为不知道你要cut啥,所以必须有参数。
# 常用的就三个-b(字节),-c(字符),-f(域)
cut -b 5 file # cut出file里面第5个字节
cut -c 5 file # cut出file里面第5个字
paste
# 粘贴命令,更重要的功能是用来把几个文件内容合起来
paste -d -s -file1 file2
# -d指定分隔域
paste -d \t
# -s 合并成行
# - 标准输入
join
# 可以将两个文...
肿瘤体细胞基因突变高通量测序(1)
今天开始更新一个新系列,跟着大神们做一个实际的项目。希望能跟得上哦!
事情是这样的,有一个这样的东西2017年全国肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质评。然后,接下来的几天,将以里面提供的数据来,来做一系列的分析。
首先来下载数据:
百度网盘
也可以通过ftp下载
命令行操作如下:
# 登陆你的服务器
ftp 211.103.138.229
# 输入账号:NCCLBIPT
# 输入密码:nccl123456
mget xxxxxxxx
# 最后用mget获取你需要的下机数据,分别有三种平台的数据,选其一就好。
前几天的任务就是下载数据,完毕。
生信懂得简单的linux就可以啦(3)
原文再续,书接上一回!
head
# head命令很简单,就是用来查看文件的头几行的,默认是10
head a.txt
# 可以查看指定的行数,例如20行
head -20 a.txt
tail
# 与head相对应,tail是用来查看后几行的
tail a.txt
tail -20 a.txt
# tail还能查看文件的更新过程,需要参数-f
tail -f a.txt
more
# more用来一页一页看文件的内容,space(空格)为下一页,b为上一页。
more a.txt
# 限制每页行数,12行
more -12 a.txt
# 用参数-s不显示空白的行
more -s a.txt
# 查找字符串
more +/string a.txt
# 查找下...
生信懂得简单的linux就可以啦(2)
好烦啊
我必须快速思考,快速行动。
cp
# 复制文件,只有源文件较目的文件的修改时间新时,才复制文件
cp -u -v file1 file2
# 将文件file1复制成文件file2
cp file1 file2
# 将文件file1复制成file2,因为目的文件已经存在,所以指定使用强制复制的模式
cp -f file1 file2
# 将目录dir1复制成目录dir2
cp -R file1 file2
# 同时将文件file1、file2、file3与目录dir1复制到dir2
cp -R file1 file2 file3 dir1 dir2
# 复制时保留文件属性
cp -p a.txt tmp/
mkdir
# 在目录/usr/xx下建立子目录tes...
生信懂得简单的linux就可以啦(1)
祝自己生日快乐。
因为服务器基本都是用linux系统的,而且都是命令行操作,敲着敲着看着就酷炫。所以,第一期的linux操作先介绍几个简单的命令。
pwd
# 查看当前路径
pwd
# 查看链接的路径
pwd -P
ls
# 列出当前目录下的文件和文件夹
ls
# 列表模式,显示大小和权限
ls -l
# 显示隐藏文件(以.开头的文件)
ls -a
# 以修改时间列出
ls -ltr
cd
# 打开文件夹
cd [dir]
# 打开上层目录
cd ..
# 打开上上层目录
cd ../..
# 打开主目录
cd ~
# 打开前一目录
cd -
mv
# 将当前目录下的a文件移动到b文件夹
mv a b/
# 一次移动多个文件
mv a1 a2 a3 ...
yaml
久违的更新。台湾生活节奏太慢了让我整个人变懒了。
yaml是一种配置语言。可以被很多其他的语言读取。来起到一个传入参数的作用。
首先我们要有一个配置文件,例如config.yaml
languages:
- R
- Java
- Python
Alpha:
a
b
c:
'c1'
'c2'
'c3'
例如上面的,languages和Alpha算同一等级,然后当前面有“-”,就是一个数组。我们通过引用yaml库,可以轻易的导入这堆参数。
在python中的用法
import yaml
con = open('config.yaml')
conf = yaml.load(con)
# 这时候,conf其实就是一个dictionary。
print co...
共计 204 篇文章,26 页。