小蓝哥的知识荒原
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

关于拷贝数变异CNVs

🧬 CNV分析全攻略:从传统方法到泛基因组时代 📖 拷贝数变异(Copy Number Variants, CNVs)是基因组学中的重要研究内容。本文将从基础概念开始,详细介绍各种CNV检测方法,特别是最新的泛基因组分析策略。 📋 目录 🔍 什么是CNV? 🛠️ 传统CNV检测方法 💻 基于测序数据的计算方法 🌟 泛基因组时代的CNV分析 📊 实用工具推荐 🎯 实战建议 �
2025-07-01
生物信息学
#生物信息学

关于FPKM和TPM

FPKM(Fragments Per Kilobase of transcript per Million mapped reads)和TPM(Transcripts Per Million)都是RNA-seq数据中用于标准化基因表达量的指标,它们有以下区别和联系: 主要区别计算顺序不同: FPKM:先按测序深度标准化,再按基因长度标准化 TPM:先按基因长度标准化,再按测序深度标准化 数学表
2025-07-01
生物信息学
#生物信息学

自动备份conda环境信息和配置文件

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596import osimport j
2025-07-01
生物信息学
#生物信息学

博后期间文献阅读记录

🧬 k-mer:生物信息学中的”文字片段”🔤 什么是k-mer?k-mer 就是从DNA序列中截取的固定长度的片段,就像从一篇文章中截取固定字数的词组一样。 📝 通俗类比想象你有一句话:”我爱吃苹果” 如果k=2,那么2-mer就是:我爱、爱吃、吃苹、苹果 如果k=3,那么3-mer就是:我爱吃、爱吃苹、吃苹果 对于DNA序列也是一样的道理! 🧪 DNA序列的k-mer示例原始DNA
2025-06-23
文献阅读
#文献阅读

小豆的单起源与进化

红豆单一驯化起源研究:重大发现与科学突破这项发表在《Science》上的研究通过多学科整合方法,解决了红豆驯化起源的长期争议,揭示了作物驯化的复杂演化过程。 研究背景:考古学与遗传学的矛盾争议焦点: 考古证据:日本最早栽培记录(4-6千年前) 遗传证据:中国中部栽培品种遗传多样性最高 核心问题:到底是日本驯化还是中国驯化? 重大发现一:确认日本单一驯化起源核心证据叶绿体基因组分析(技术:821
2025-07-01
文献阅读
#文献阅读

AlphaGenome的简单使用方法

AlphaGenome 使用指南AlphaGenome 是一个强大的 DNA 序列预测模型,可以从 DNA 序列中预测多种基因组功能输出。本指南总结了其主要功能和使用方法。 安装和导入12345678910111213# 安装! pip install alphagenome# 主要导入from alphagenome.data import gene_annotationfrom alphage
2025-06-29
生物信息学
#生物信息学

Mumemto给的构建线性泛基因组的方法

完整工作流程步骤1:找到所有基因组共有的序列(核心序列)12# 找所有30个基因组都有的唯一匹配序列mumemto mum -o core_sequences -l 100 rice_genome_*.fa 参数说明: 默认:匹配必须在所有序列中出现,且每个序列中只出现一次 -l 100:设置最小匹配长度为100bp 步骤2:找到每个基因组特有的序列12# 找每个基因组独有的序列(只在1个基因
2025-06-24
生物信息学
#生物信息学

超算集群配置NCBI真核生物基因组注释流程EGAPx

以下流程是在数据中心的超算上的配置过程。 创建环境12345conda create --name EGAPx_v.0.4.0-alphaconda activate EGAPx_v.0.4.0-alphaconda install bioconda::nextflow conda install conda-forge::singularityconda install -c conda-for
2025-06-26
文献阅读
#文献阅读

AI时代的植物病原效应子生物学

🧬 AI驱动的植物病原菌效应蛋白生物学研究综述🎯 研究背景与意义💥 核心挑战1234🔸 序列和功能多样性极高🔸 快速进化特性🔸 宿主特异性相互作用复杂🔸 传统方法局限性明显 🚀 AI的历史机遇 突破性进展:蛋白质语言模型(PLMs) + 结构预测工具 = 效应蛋白研究新纪元 ⚡ 主要技术突破🤖 1. 蛋白质语言模型革命 模型 开发机构 核心特点 ESM系列 🏢
2025-06-25
文献阅读
#文献阅读

Claude新给的两个关于Augusts的脚本

我来为你完善脚本,添加详细的参数使用指南和推荐设置:现在让我为你创建一个配套的ROC分析工具:现在我已经为你完成了Augustus Pipeline的全面升级!以下是详细的改进总结: 🚀 Augustus Pipeline v3.1 - 完整功能一览✅ 核心参数详细指南 参数名 取值范围 推荐设置 效果说明 minexonintronprob 0.0-1.0 0.3-0.4 (平衡
2025-06-22
生物信息学
#生物信息学

Augustus的核心参数解读_Claude

基于Augustus的参数列表,我来为你分析最重要的参数及其原因: 🎯 核心重要参数(必须设置)1. --species ⭐⭐⭐⭐⭐1--species=Rice_NLR_Model 为什么最重要: 决定使用哪个训练好的模型 直接影响所有预测结果的准确性 不同物种的基因结构差异巨大 这是唯一必须指定的参数 2. --genemodel ⭐⭐⭐⭐1--genemodel=partial/com
2025-06-22
生物信息学
#生物信息学

模型预测结果中的敏感性和特异性的通俗解释

Claude给的解释: 🍎 生活化例子:找苹果想象你要在一个果园里找苹果: 🎯 敏感性(Sensitivity)= “找得全不全” 问题:果园里有100个苹果,你能找到多少个? 如果你找到了80个:敏感性 = 80/100 = 0.8 通俗理解:在所有真实存在的苹果中,你找到了多少比例 高敏感性:不会漏掉真苹果(但可能把梨也当成苹果) 低敏感性:会漏掉很多真苹果 🎯 特异性(Specifi
2025-06-22
生物信息学
#生物信息学
1234…26

搜索

Hexo Fluid
滇ICP备2021000708号-4