HLA区域reads提取
一般的HLA分析软件需求输入fastq文件或bam文件,更建议是从fastq出发。使用全外的数据或大panel数据比对后,再从比对完成后的bam文件中提取出HLA区域的reads,形成较小的fastq,方便后续分析。
可以使用samtools进行提取,例
samtools view sample.bam \
chr6:28477797-33448354 chr6_apd_hap1:1-4622290 \
-b > sample.HLA.bam
samtools view sample.bam -bh -f 12 -@ 8 > sample.unmapped.bam
samtools merge sample.merge.bam sample.HLA.bam sampl...
尝试接近illumina TSO500 分析流程
从illumina公布的文档可以看到目前illumina是怎么进行生信分析的,illumina是通过自有平台把自己的软件都搭起来。不过,部分软件已在GitHub开源,所以我们也是可以用这部分的软件进行流程搭建的。
开始之前
illumina的开源软件打包成了dll,在linux里使用需要安装dotnet。可以参照微软官方教程进行安装。这里我选择ubuntu上的dotnet安装教程。
找到了18.04版本ubuntu的dotnet安装命令,照着装就可以了。
首先将 Microsoft 包签名密钥添加到受信任密钥列表。
wget https://packages.microsoft.com/config/ubuntu/18.04/packages-microsoft-prod.deb...
爬取CHPO数据库
CHPO即china HPO,是在中文人类表型标准用语联盟倡导下建立的一个公共网站,希望提供一个共享的平台有助于研究人员和医学专家共同翻译编辑Human Phenotype Ontology,以形成一个中文版的HPO。
通过查看网页源代码,发现想要的中文翻译等信息不在源码中,因此用常规的requests可能不行,因此使用selenium通过模拟浏览器进行。由于我用的是新版edge浏览器,因此需要先到微软找找文档。微软自己有一篇介绍selenium如何调用edge的文章,需要安装指定版本的python包。
pip install msedge-selenium-tools selenium==3.141
同时下载与自己目前使用的edge版本相同的webdriver。
到chpo...
爬取CKB数据库
Jax Ckb是比较常用的肿瘤相关位点注释的数据库。曾几何时数据库还是免费查询的,现在部分基因如EGFR已经转到了高级版本中,不过免费版还是能查若干基因的。
参考文章python多线程爬取CKB数据库对CKB数据库的核心基因位点注释进行爬取,修改了其中解析部分,以及补充上位点描述。
import requests
import bs4
from bs4 import BeautifulSoup
import threadpool
# 获得网页源码
def getHTMLText(url):
try:
r = requests.get(url, timeout=40)
r.raise_for_status()
r.encod...
根据转录本号找内含子
总所周知,融合基因的断点大都在内含子上,这时我们有一个基因的转录本号,比如NM_004304(ALK),需要找到18号内含子。
查找的方法有通过ensembl或者biomart包,又或者cruzdb库来找。以前做过类似的事。
不过想着既然本地已经有refFlat在了,干脆就解析refFlat好了。
refFlat文件从左到右,每一列分别是基因名,转录本名,染色体编号,方向,转录本起始,转录本终止,cds起始,cds终止,外显子个数,各个外显子起始,各个外显子终止。
这时,简单的把上一个外显子的终止和下一个外显子的起始来当作中间夹杂的内含子的起始和终止位点。
本来想用cut管道做的,但是我不会,所以后面用python算了。
cat refFlat.txt | grep NM...
UMI的处理
唯一分子标记(UMI)是一种分子条形码,可以在测序过程中错误校正,提高准确性。使用生信流程对下机数据进行处理,根据UMI可以确定唯一read,从而在最终数据分析之前消除已识别的错误,因为有助于检测DNA样本中罕见和低频的体细胞变异,因此多用于血浆中分离的cfDNA。
例如双端4bp UMI的数据,可进行以下处理。
fastp流程
使用fastp可以将UMI提取加入到read Name中,再使用gencore来去重即可。一般的由于是使用多重PCR的检测方式,而引物长度一般是20bp,所以把后面20bp也过滤掉。
fastp -i test.R1.fq.gz -I test.R2.fq.gz \
-o test.R1.clean.fq.gz -O test.R2.clean.fq....
oculus quest2 流程与感想
前情提要
到货
从美亚入手了oculus quest2含税包邮大概是2232元人民币,速度还挺快的,1月31日下单,2月5日就到了。到手后就着手激活,但是之前考虑的激活流程无法激活。查了下大概是clash还是走不了UDP通道还是啥来着。原以为很轻松,然而我在这里居然卡了一个小时(为了找个合适的方法)。
最后我用了Netch来进行魔法。和clash不同,Netch是创建了一个虚拟网卡,通过虚拟网卡来实现魔法(必须安装TAP-windows)。按照Github页面上的这篇教程,就能安装完成。完成后还是同样的,把自己的机场填进去,然后最重要的一步是代理必须选择TUN/TAP那个模式。然后打开win10的热点,再在网络适配器中选择tap的网卡,右键属性然后共享,下拉选择热点的网卡。
这时...
oculus quest2激活
为了玩Half-Life: Alyx,在美亚买了一台oculus quest2,目前装备未到货,但是在之前看到很多说激活麻烦的,先来预习一下。
看了几篇文章,激活设备的难点主要在于魔法上网,那么其实对我来说就没有难点。主要是看用什么样的方式连进魔法WiFi。
连魔法路由
我本来是有个华硕的ac68u刷了梅林的,可以轻松在路由器层面实现魔法,但是后面升级到WiFi6的时候换成了小米的ax1800,把ac68u卖掉了。然后魔法的事情留给了PC来做,毕竟家里除了我也没有别的Google重度依赖者。
然后我查了一下,发现ax1800也是可以开启ssh然后装clash来实现魔法的。首先参考这篇文章,开启ax1800的ssh。然后使用再ssh进去装一个shell下的clash。再自己找个机场就...
共计 204 篇文章,26 页。