生物信息学常用软件 持续输出中。。。。。。 1 Annovar1.1 参考文献ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data 1.2 功能概述对变异(SNP和INDLE等)进行注释。 1.3 下载安装从https://www.openbioinformatics.org/annovar/an 2025-05-29 生物信息学 #生物信息学
README4biohelpers Some useful script tools written during data processing. Installation12345git clone git@github.com:lixiang117423/biohelpers_python.gitcd biohelpers_pythonpip install -e . or: 1pip install biohelpers D 2025-06-06 生物信息学 #生物信息学
结构方程模型计算Fisher's C值 12345678910111213141516171819202122232425262728rm(list = ls())# 安装并加载必要的包library(piecewiseSEM)library(lavaan)# 读取数据dat <- read.csv("~/Downloads/MYDATA(1).csv", header = T, row.names = 1)all.scaled 2025-06-05 生物信息学 #生物信息学
Claude给的基因组组装和注释的流程代码 数据准备和质控1. 数据质量评估1234567891011# 短读长数据质控 (Illumina)fastqc short_reads_R1.fastq.gz short_reads_R2.fastq.gz -o qc_reports/# 长读长数据质控 (Nanopore)NanoPlot --fastq nanopore_reads.fastq.gz --outdir nanopore_qc/ 2025-05-27 生物信息学 #生物信息学
BSA测序的原理和分析 BSA(Bulk Segregant Analysis,混合分离分析)是一种分子标记辅助的基因定位技术。我将从原理、方法、分析和代码实现等方面详细阐述。 1 BSA原理BSA基于孟德尔遗传定律,通过构建具有极端表型的DNA混合池来快速定位控制目标性状的基因或QTL。核心原理是: 分离群体构建:杂交后代中,控制目标性状的基因区域在极端表型个体中会表现出不同的等位基因频率 DNA混合:将具有相同极端 2025-05-27 生物信息学 #生物信息学
泛基因组时代中的序列到图映射算法综述 1 背景与意义传统线性参考基因组存在参考偏倚问题,导致非参考等位基因被遗漏或错误映射。泛基因组(Pangenome)通过整合多个个体基因组构建图结构,提供更全面的遗传多样性参考。序列到图映射(Sequence-to-Graph Mapping, S2G) 是泛基因组分析的核心技术,支撑变异检测、基因分型、长读长纠错等应用。近年来已有20余种S2G算法开发,但此前尚无系统性综述。 2 泛基因组图的表 2025-05-26 生物信息学 #生物信息学
基因注释软件BRAKER学习笔记 1 BRAKER3的优势 可以使用转录组和蛋白数据2 基因预测成功的关键 高质量的基因组:short scaffolds太多的话不会得到很准确的结果。 简单的序列名称:如Chr1这种是最好的。 要标记重复序列:the genome should be masked for repeats,避免对重复序列和低复杂度区域预测到基因结构;转录组数据比对是重复序列也会影响;在GeneMark-ES/ET/ 2025-05-09 生物信息学 #生物信息学
我的生物信息学知识合集 写在前面趁着这次培训,把学的东西都整理一下。不断更新,想到啥更新啥。。。。。。 软件推荐 ssh工具:目前在用的是Tabby,比较满意的是在一个窗口就可以实现ssh+文件的上传下载。 markdown工具:现在在用的是Typora,付费版本。 代码编辑工具: R:RStudio 其他:VS Code 软件安装VScode使用VScode主要是为了方便远程连接服务器进行远程开发。体验了几次, 2022-12-31 生物信息学 #生物信息学
结构变异可视化工具SVbyEye 1 IntroductionGitHub地址文章链接 使用手册大佬Evan E. Eichler团队基于Miropeats开发的用于基因组结构变异可视化的工具SVbyEye,使用ggplot2绘图语法实现。 2 PAF格式输入文件需要输入的文件是PAF格式的,官方使用的比对软件是minimap2 (version >=2.24),但是任何sequence-to-sequence比对生成的结果 2025-05-09 生物信息学 #生物信息学
泛基因组工具vg vg:variation graph data structures, interchange formats, alignment, genotyping, and variant calling methods. 1 基础知识vg其实就是variation graph的缩写:),一个vg中有这些元素: 1.1 **Node**(节点) 定义:表示基因组中的一段序列片段,可以是: 核心基因( 2025-05-09 生物信息学 #生物信息学
PGGB学习笔记 0.1 文献笔记泛基因组包含了所有的序列、基因组间的同源性和所有的变异类型。泛基因组可以用于变异检测、保守性估计、重组事件评估和推断系统发育关系。现有的方法使用reference的策略和tree-guide的方法构建泛基因组,这些方法得到的遗传变异信息会不完整,也不稳定。现有的方法基本上就是把与参考基因组足够相似的序列添加到参考基因组上,这些方法后对结构上高度可变的区域进行修剪处理,例如着丝粒和其 2025-05-09 生物信息学 #生物信息学
BRAKER学习笔记 1 BRAKER3的优势 可以使用转录组和蛋白数据2 基因预测成功的关键 高质量的基因组:short scaffolds太多的话不会得到很准确的结果。 简单的序列名称:如Chr1这种是最好的。 要标记重复序列:the genome should be masked for repeats,避免对重复序列和低复杂度区域预测到基因结构;转录组数据比对是重复序列也会影响;在GeneMark-ES/ET/ 2025-04-25 生物信息学 #生物信息学