用iTools来统计下机数据质量值
iTools是一个非常好用的工具包,目前有以下的功能:
1 Fatools main deals with Fasta format;
2 FqTools main deals with Fastq format;
3 SOAPtools deals with SOAP format which is the result of SOAP[3].
4 CNSTools deals with cns format which is the result of soapsnp[4].
5 XamTools deals with s...
UCSC在线对vcf进行注释
就是这个网址:
hgVai。
全称是UCSC Variant Annotation Integrator。
上面这里选择Mammal(哺乳动物)、Human(人类)、参考基因组。
还可以选择需要分析的区域,一般默认genome(就是所有区域)。
下面可以点击add custom tracks来导入自己的vcf文件。variants再选择自己导入的tracks。
然后下面可以选择SIFT等预测工具。
最后点击Get results提交,就可以啦!
使用在线的sift
就是这个网址:
sift。
SIFT根据序列同源性和氨基酸的物理性质预测氨基酸替换是否影响蛋白质功能。
应用于天然存在的非同义多态性和实验室诱导的错义突变。
这里提供了好几个在线的工具。这次我需要的是预测一个插入突变,所以选择下面的Classify coding indels。
然后选上参考基因组,看一下例子。
需要逗号分隔。
比如说下面这个:
X,99663401,99663401,1,GA
意思是,chr,start,end,orientation(1正链,-1负链),indel(如果是ins就填插入的碱基,如果是del就填/)。
下面可以选择额外的信息,我是这样选的:
得到结果,可以看到预测是有害的。
然后点击Protein Sequence Change...
新建用于annovar的cosmic数据库
众所周知,annovar提供的cosmic数据库到v70就没了,原因是cosmic开始区分学术账户和商业账户,开始限制下载。
目前cosmic的最新版本是v85。
annovar还是提供了制作cosmic数据库的方法:
第一步,当然先去cosmic下载数据:
Cosmic Download
前提是,你需要有一个拥有下载权限的账户。
annovar需要的是以下这4个文件:
CosmicCodingMuts.vcf.gz
CosmicNonCodingVariants.vcf.gz
CosmicMutantExport.tsv.gz
CosmicNCV.tsv.gz
我下载了b37版本的,下载下来之后,先解压
gunzip *.gz
第二步,使用annovar提供的脚本:
...
jax-ckb体细胞变异数据库
这次来介绍一个数据库。
jax-ckb。
全称是JAX-Clinical Knowledgebase。
一般的,可以用来搜寻和靶药相关的信息。
可以按基因、位点、药物的分组、肿瘤类型来查找。
比如说我要找EGFR T790M这个位点的相关药物研究信息。
只要通过查找EGFR基因,再找到T790M变异就好了。
可以看到有关于这个位点的解释以及文献出处。
下面还有很多关于这个位点的用药证据说明。
就这样。
跟着做一个RNA-seq
参照的是这篇文章的流程:
PMID:27560171
先下载安装需要的软件:
HISAT2
StringTie
Ballgown
gffcompare
#安装软件
# HISAT2
wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-Linux_x86_64.zip
unzip hisat2-2.1.0-Linux_x86_64.zip
# StringTie
wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.4d.Linux_x86_64.tar.gz
tar -zxvf stringtie-1.3.4d.Linu...
共计 204 篇文章,26 页。