主页

用R处理ab1数据

不多说,直接上代码! #加载sangerseqR包 library(sangerseqR) #读入数据 seq = readsangerseq('input.ab1') #读取碱基数据,0.33指的是将达到主峰0.33的次峰定义为杂合子峰 bc = makeBaseCalls(seq, ratio = 0.33) #读主峰 primarySeq(seq) #读次峰 secondarySeq(seq) #输出可视化图像 chromatogram(bc, showcalls = 'both') 结果如下:

阅读更多

HLA分型与资料数据库

HLA是一个非常难的项目,查了无数资料和网站,发现了这个,资料很丰富。 HLA-alleles。 HLA 系统是目前所知人体最复杂的多态系统。 自1958年发现(Jean Dausset)第一个HLA抗原,到20世纪70年代, HLA便成为免疫遗传学、免疫生物学和生物化学等学科的一个重要新兴研究领域。 现在,已基本弄清其系统的组成、结构和功能,阐明了其理化性质和生物学作用。 这些研究成果不仅具有重要的理论意义,而且具有巨大的生物医学价值。 在生信的领域,主要就是通过确定HLA基因的分型,来通过分型设定对应的治疗方案。 比如说HLA-B*58:01,HLA-B*27。这是比较常见的相关区域。 HLA-alleles这个网页提供了每个HLA区域的分型表。 比如说HLA-B区 可...

阅读更多

annovar

测序下来的数据,经过variant call/SNP calling之后,想要得到更多的信息,就要拿去注释。annovar就是一款注释软件。 主要包含三种不同的注释方法,Gene-based Annotation(基于基因的注释)、Region-based Annotation(基于区域的注释)、Filter-based Annotation(基于筛选的注释)。 第一步 安装perl。由于annovar是用perl写的,所以先要安装perl。然后,再下载annovar。下载下来的,其实是一堆perl脚本,然后windows要把这些东西弄成环境变量。 annotate_variation.pl #主程序,功能包括下载数据库,三种不同的注释 coding...

阅读更多

B-L-A-S-T!blast

BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 就是说!如果你有一段序列,不管是DNA,RNA还是蛋白质序列,把它扔进blast里跑一下,就能比对出最相近的结果!也就是说,如果你不知道这段东西的是啥,blast一下你就知道啦! 原理:将你的input序列和库中的序列进行匹配度打分,分数高列出来! 首先来看看NCBI提供的在线的blast工具 可以看到,一共有五种blast!分别有什么用呢! 所查序列作一对一的序列比对。 BLASTX是核酸序列到蛋白库中的一种查询。先...

阅读更多

连金鱼都能看懂的git简明教程!

Git是一个用来做版本控制的系统。好比说,你修改了文件之后,要记录下你改了啥。同时,git允许多人协作,你在这边改了,别人那里也能看到! github则是一个码农交友网站托管代码的网站,还可以偷偷当网盘用。看名字就知道这俩东西很有关系! 这是个简明教程!不会介绍很复杂的技巧(因为我也不会)! 话不多说! windows,先去把git下载装好了! 然后,也建议装上github desktop,还有自己去申请个github账户。 初次使用git,先设置一下本地的git账户! git config --global user.name 'yourname' git config --global user.email 'yourname@yourmail.com' 然后要让gi...

阅读更多

Chromas

Chromas是一款用来处理/查看 Sanger测序的下机数据(*.ab1文件)的软件。界面简单看起来舒服。 下面介绍使用方法: 打开软件,Open你想要查看的ab1文件。 比如,我打开的是rs1127354这个位点的Sanger测序下机数据。通过到NCBI搜索,可以得到这个位点的前后序列。 CTAGGAGATAAGTTT[C]CATGCACTTTGGTGG 复制后面的一段: CATGCACTTTGGTGG 然后在chromas中搜索 注意这里,最下面的85%是设定的相似程度,如果需求的是100% match,就选择match exactly。 找出来之后的结果。 可以看到,前后序列对应之后,我们要找的SNP位点,同时有蓝色和绿色两个峰,所以判读为杂合子:CA。 如...

阅读更多

SNPedia

SNPedia是一个我挺喜欢用来搜snp信息的网站,它聚合了很多其他数据库的内容,很好用! 主页: Snpedia 举个栗子: rs671是一个比较热门的位点,和酒精有关。 左边是一个梗概性的描述,然后下面是很多的参考文献(PMID)。右边是这个位点,不同的基因型下不同的临床表现。 右边可以看到SNPedia引用的地方很多!我比较关注的是pharmgkb和23andme。 然后滚滚滚到下面,右下角是一个clinvar的注释,clinvar也是一个很重要的数据库。 以上就是snpedia的一个简单的rsid页面。 SNPedia还有一些搜索方式,比如搜一个HLA的分型,例如在风湿病中经常检测的HLA-B*27。 不截图了,自己进去看吧!

阅读更多

什么是SNP

这是个非常简单又非常重要的东西,经常会遇到! 我记得我去面试的时候,就被问了这个问题:什么是SNP。 我:不知道! 然后就过了面试。 SNP全称是Single Nucleotide Polymorphisms(单核苷酸多态性)。按照我的理解,就是单个碱基的变异(转换、颠倒、缺失、插入)。 然后!每个SNP,都有相对应的‘rsid’,中文我们喊‘rs号’。rsid是NCBI给每个SNP的编号,别的数据库也有他们自己对于SNP的编号,不过因为NCBI是现在最常用的数据库,所以一般以rsid为准! 常用的查询SNP的地方:dbSNP 百科解释: 维基百科 百度百科

阅读更多