TMB笔记
肿瘤突变负荷(Tumor Mutational Burden,TMB)为肿瘤基因组区域中每兆碱基(Megabase,Mb)发生的碱基替换突变 和插入缺失突变的数量总和,单位为 muts/Mb。
关于TMB杂七杂八的东西 ,过几天再梳理一下。
TMB 国家参考品
中国食品药品检定研究院
PMID32217756,PMID34606929
肿瘤NGS大panel|肿瘤大panel检测的标准化及研究进展
中检院: 关于发布《组织肿瘤突变负荷(TMB)检测试剂(高通量测序法)技术评价指南》的公告
Driver Gene参考
参与以上项目的部分公司的专利文书
一种肿瘤突变负荷标准品及其制备方法和试剂盒-菁良基因-CN111118167A
基于高通量靶向测序分析肿瘤突变负荷...
Control-FREEC的使用
Control-FREEC是一款广受好评的WGS、WES数据CNV检测软件。
安装
当前最新版本是v11.6(29 May 2020)。
下载源码编译安装
wget https://github.com/BoevaLab/FREEC/archive/refs/tags/v11.6.tar.gz
tar -zxvf v11.6.tar.gz
cd FREEC-11.6/src
make
获得编译后的freec执行程序。
如果需要统计GC比例,还需要安装gccount
wget http://bioinfo-out.curie.fr/projects/freec/src/gccount.tar.gz
tar -zxvf gccount.tar.gz -C gccount
g...
WisecondorX的使用
使用WisecondorX来进行NIPT分析。
安装
可通过pip或者conda来安装WisecondorX,注意pip安装并不会同时安装依赖的R包。
通过pip安装
pip install -U git+https://github.com/CenterForMedicalGeneticsGhent/WisecondorX
通过conda安装
conda install -f -c conda-forge -c bioconda wisecondorx
在docker hub中找到一个可用的镜像
docker pull hindrek/wisecondorx:1.0.0
使用
wisecondorX的输入文件是bam或者cram,官方建议使用bowtie2进行比对...
尝试用playwright写爬虫
playwright是微软开源的一个自动化测试Chromium、Firefox和WebKit的python工具,很明显,这种工具往往都会被用来做爬虫。
首先需要安装playwright
pip install --upgrade pip
pip install playwright
playwright install
以上步骤会按照python的playwright库,然后按照Chromium、Firefox和WebKit等的测试工具。
官方文档中介绍了很多使用方式,这里还有一篇介绍playwright、selenium等工具差异的文章。
以爬取DECIPHER gene这个页面为例,使用下面命令打开新窗口,默认是使用chromium
playwright codege...
NIPT
非侵入性胎儿染色体基因检测(英语:Non-Invasive Fetal Trisomy Test,缩写:NIFTY 或英语:Non-Invasive Prenatal Test,缩写:NIPT)是一种崭新的产前检查技术,不需要透过高侵入性的羊膜穿刺术取样,仅须透过静脉采血抽取母亲的血液,就能侦测到胎儿在母血中微量的游离DNA,透过二代测序技术,可以精准检测胎儿染色体异常的状况。相较于侵入性产前诊断方法-羊膜穿刺术,非侵入性胎儿染色体基因检测仅须透过静脉抽血,是非常安全的产检方式,并不会造成流产与羊膜腔感染的危险,更大幅降低孕妇接受产前检查的恐惧感,提高孕妇接受产前染色体检查的意愿。Wiki
NIPT检测内容
NIPT检测染色体的整倍数型变异,常规的NIPT检测内容包括21号染色体三...
SKlearn LinearSVC
记录一些用得上的。
数据初始化
使用pandas对数据进行处理,将分类转换为数字。
数据表样式是
Sample
Class
Feature1
Feature2
Feature3
Feature4
S1
Pathogenic
0
2
8
1
S2
Benign
6
2
5
0
S3
Other
9
3
7
1...
爬取OMIM数据库
OMIM数据库收录了大量的基因与遗传病相关信息。
根据观察可通过https://omim.org/entry/{mimID}这个规律的链接进行爬取。因此先要找到mimID的列表,可以在这个页面下载mim2gene.txt,解析后获得。
OMIM的Robots规则允许google和bing爬取entry下的页面,允许的延迟是2s。因此爬取时,设置UA头为bingbot以及使用2s以上的延迟。
使用request进行爬取。因为未知要将结果处理为什么格式,所以不采用边爬取边解析的策略,而是爬取保存后,再进行解析。
爬取
以下是爬取python代码。其中,如果需要使用ip代理,使用的ip需要自行替换。可以建立一个ip池,再随机从ip池中抽取,下面的代码未涉及这步。另外增大延迟到4~1...
共计 204 篇文章,26 页。