小蓝哥的知识荒原
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

Annovar自动化脚本

ANNOVAR 自动化注释流程脚本目录 简介 主要功能 环境要求 安装与准备 使用方法 基本用法 参数详解 分步执行 工作流程详解 输出文件 注意事项 简介本项目是一个功能强大的Python脚本,旨在自动化执行ANNOVAR对VCF文件的完整注释流程。它特别适用于非模式生物或使用自定义基因组注释(GFF3文件)的研究场景。 脚本将从原始的GFF3注释文件和基因组序列文件开始,自动生成ANNO
2025-07-11
生物信息学
#生物信息学

从gff文件提取基因信息都脚本

2025-07-11

从VCF文件提取单倍型信息都脚本

2025-07-11

超算上使用Parabricks

功能概述自动识别样品信息,批量运行Parabricks. Python脚本可以命名为05.run_parabricks.py 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273
2025-07-07
生物信息学
#生物信息学

关于拷贝数变异CNVs

🧬 CNV分析全攻略:从传统方法到泛基因组时代 📖 拷贝数变异(Copy Number Variants, CNVs)是基因组学中的重要研究内容。本文将从基础概念开始,详细介绍各种CNV检测方法,特别是最新的泛基因组分析策略。 📋 目录 🔍 什么是CNV? 🛠️ 传统CNV检测方法 💻 基于测序数据的计算方法 🌟 泛基因组时代的CNV分析 📊 实用工具推荐 🎯 实战建议 �
2025-07-01
生物信息学
#生物信息学

关于FPKM和TPM

FPKM(Fragments Per Kilobase of transcript per Million mapped reads)和TPM(Transcripts Per Million)都是RNA-seq数据中用于标准化基因表达量的指标,它们有以下区别和联系: 主要区别计算顺序不同: FPKM:先按测序深度标准化,再按基因长度标准化 TPM:先按基因长度标准化,再按测序深度标准化 数学表
2025-07-01
生物信息学
#生物信息学

自动备份conda环境信息和配置文件

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596import osimport j
2025-07-01
生物信息学
#生物信息学

博后期间文献阅读记录

🧬 k-mer:生物信息学中的”文字片段”🔤 什么是k-mer?k-mer 就是从DNA序列中截取的固定长度的片段,就像从一篇文章中截取固定字数的词组一样。 📝 通俗类比想象你有一句话:”我爱吃苹果” 如果k=2,那么2-mer就是:我爱、爱吃、吃苹、苹果 如果k=3,那么3-mer就是:我爱吃、爱吃苹、吃苹果 对于DNA序列也是一样的道理! 🧪 DNA序列的k-mer示例原始DNA
2025-06-23
文献阅读
#文献阅读

小豆的单起源与进化

红豆单一驯化起源研究:重大发现与科学突破这项发表在《Science》上的研究通过多学科整合方法,解决了红豆驯化起源的长期争议,揭示了作物驯化的复杂演化过程。 研究背景:考古学与遗传学的矛盾争议焦点: 考古证据:日本最早栽培记录(4-6千年前) 遗传证据:中国中部栽培品种遗传多样性最高 核心问题:到底是日本驯化还是中国驯化? 重大发现一:确认日本单一驯化起源核心证据叶绿体基因组分析(技术:821
2025-07-01
文献阅读
#文献阅读

AlphaGenome的简单使用方法

AlphaGenome 使用指南AlphaGenome 是一个强大的 DNA 序列预测模型,可以从 DNA 序列中预测多种基因组功能输出。本指南总结了其主要功能和使用方法。 安装和导入12345678910111213# 安装! pip install alphagenome# 主要导入from alphagenome.data import gene_annotationfrom alphage
2025-06-29
生物信息学
#生物信息学

Mumemto给的构建线性泛基因组的方法

完整工作流程步骤1:找到所有基因组共有的序列(核心序列)12# 找所有30个基因组都有的唯一匹配序列mumemto mum -o core_sequences -l 100 rice_genome_*.fa 参数说明: 默认:匹配必须在所有序列中出现,且每个序列中只出现一次 -l 100:设置最小匹配长度为100bp 步骤2:找到每个基因组特有的序列12# 找每个基因组独有的序列(只在1个基因
2025-06-24
生物信息学
#生物信息学

AI时代的植物病原效应子生物学

🧬 AI驱动的植物病原菌效应蛋白生物学研究综述🎯 研究背景与意义💥 核心挑战1234🔸 序列和功能多样性极高🔸 快速进化特性🔸 宿主特异性相互作用复杂🔸 传统方法局限性明显 🚀 AI的历史机遇 突破性进展:蛋白质语言模型(PLMs) + 结构预测工具 = 效应蛋白研究新纪元 ⚡ 主要技术突破🤖 1. 蛋白质语言模型革命 模型 开发机构 核心特点 ESM系列 🏢
2025-06-25
文献阅读
#文献阅读
1234…26

搜索

Hexo Fluid
滇ICP备2021000708号-4