主页

TMB笔记

肿瘤突变负荷(Tumor Mutational Burden,TMB)为肿瘤基因组区域中每兆碱基(Megabase,Mb)发生的碱基替换突变 和插入缺失突变的数量总和,单位为 muts/Mb。 关于TMB杂七杂八的东西 ,过几天再梳理一下。 TMB 国家参考品 中国食品药品检定研究院 PMID32217756,PMID34606929 肿瘤NGS大panel|肿瘤大panel检测的标准化及研究进展 中检院: 关于发布《组织肿瘤突变负荷(TMB)检测试剂(高通量测序法)技术评价指南》的公告 Driver Gene参考 参与以上项目的部分公司的专利文书 一种肿瘤突变负荷标准品及其制备方法和试剂盒-菁良基因-CN111118167A 基于高通量靶向测序分析肿瘤突变负荷...

阅读更多

Control-FREEC的使用

Control-FREEC是一款广受好评的WGS、WES数据CNV检测软件。 安装 当前最新版本是v11.6(29 May 2020)。 下载源码编译安装 wget https://github.com/BoevaLab/FREEC/archive/refs/tags/v11.6.tar.gz tar -zxvf v11.6.tar.gz cd FREEC-11.6/src make 获得编译后的freec执行程序。 如果需要统计GC比例,还需要安装gccount wget http://bioinfo-out.curie.fr/projects/freec/src/gccount.tar.gz tar -zxvf gccount.tar.gz -C gccount g...

阅读更多

WisecondorX的使用

使用WisecondorX来进行NIPT分析。 安装 可通过pip或者conda来安装WisecondorX,注意pip安装并不会同时安装依赖的R包。 通过pip安装 pip install -U git+https://github.com/CenterForMedicalGeneticsGhent/WisecondorX 通过conda安装 conda install -f -c conda-forge -c bioconda wisecondorx 在docker hub中找到一个可用的镜像 docker pull hindrek/wisecondorx:1.0.0 使用 wisecondorX的输入文件是bam或者cram,官方建议使用bowtie2进行比对...

阅读更多

2021总结

2021年的最后一天。 2021年,感觉和2020相比没太大的变化。工作上又换了一家公司,对流程语言的使用更熟练。一直想学习前端但是一直没有落实。回顾去年,说想学习C++,结果也没有一点点进展。总的来说,2021迈的步子比2020要小。 2022年,预估会背上房贷,目前已在学习装修知识,希望能弄出一个稍微能称为智能家居的空间。 今年的歌单上班的基本是周杰伦,但是个人自选年度歌暂缺,没有特别喜欢的。

阅读更多

尝试用playwright写爬虫

playwright是微软开源的一个自动化测试Chromium、Firefox和WebKit的python工具,很明显,这种工具往往都会被用来做爬虫。 首先需要安装playwright pip install --upgrade pip pip install playwright playwright install 以上步骤会按照python的playwright库,然后按照Chromium、Firefox和WebKit等的测试工具。 官方文档中介绍了很多使用方式,这里还有一篇介绍playwright、selenium等工具差异的文章。 以爬取DECIPHER gene这个页面为例,使用下面命令打开新窗口,默认是使用chromium playwright codege...

阅读更多

NIPT

非侵入性胎儿染色体基因检测(英语:Non-Invasive Fetal Trisomy Test,缩写:NIFTY 或英语:Non-Invasive Prenatal Test,缩写:NIPT)是一种崭新的产前检查技术,不需要透过高侵入性的羊膜穿刺术取样,仅须透过静脉采血抽取母亲的血液,就能侦测到胎儿在母血中微量的游离DNA,透过二代测序技术,可以精准检测胎儿染色体异常的状况。相较于侵入性产前诊断方法-羊膜穿刺术,非侵入性胎儿染色体基因检测仅须透过静脉抽血,是非常安全的产检方式,并不会造成流产与羊膜腔感染的危险,更大幅降低孕妇接受产前检查的恐惧感,提高孕妇接受产前染色体检查的意愿。Wiki NIPT检测内容 NIPT检测染色体的整倍数型变异,常规的NIPT检测内容包括21号染色体三...

阅读更多

SKlearn LinearSVC

记录一些用得上的。 数据初始化 使用pandas对数据进行处理,将分类转换为数字。 数据表样式是 Sample Class Feature1 Feature2 Feature3 Feature4 S1 Pathogenic 0 2 8 1 S2 Benign 6 2 5 0 S3 Other 9 3 7 1...

阅读更多

爬取OMIM数据库

OMIM数据库收录了大量的基因与遗传病相关信息。 根据观察可通过https://omim.org/entry/{mimID}这个规律的链接进行爬取。因此先要找到mimID的列表,可以在这个页面下载mim2gene.txt,解析后获得。 OMIM的Robots规则允许google和bing爬取entry下的页面,允许的延迟是2s。因此爬取时,设置UA头为bingbot以及使用2s以上的延迟。 使用request进行爬取。因为未知要将结果处理为什么格式,所以不采用边爬取边解析的策略,而是爬取保存后,再进行解析。 爬取 以下是爬取python代码。其中,如果需要使用ip代理,使用的ip需要自行替换。可以建立一个ip池,再随机从ip池中抽取,下面的代码未涉及这步。另外增大延迟到4~1...

阅读更多