基因注释软件BRAKER学习笔记 1 BRAKER3的优势 可以使用转录组和蛋白数据2 基因预测成功的关键 高质量的基因组:short scaffolds太多的话不会得到很准确的结果。 简单的序列名称:如Chr1这种是最好的。 要标记重复序列:the genome should be masked for repeats,避免对重复序列和低复杂度区域预测到基因结构;转录组数据比对是重复序列也会影响;在GeneMark-ES/ET/ 2025-05-09 生物信息学 #生物信息学
开发一个R包 R最强大的莫过于统计分析和可视化,关键是完全的开源免费啊。有时候使用多了以后,会积累一些函数或者是数据库,而这些函数和数据库通常能够帮助到别人,这时候就可以把这些函数或者是数据库打包成R包,上传到CRAN、Bioconductor或者是GitHub,让 其他的使用者使用自己的包。 2020-01-10 R语言 #R语言
LeAFtool计算病斑面积 网页版地址: https://shiny.web4xiang.top/LeAFtool/ 分析流程数据准备将图片存储在三个文件夹内,压缩成.zip后上传就能进行分析: learning:存放用于训练的图片(直接截图即可),包括三个子文件夹: background:背景图片。如叶片是贴在A4纸上的,那么背景就截图A4纸。 limb:没有被病原菌侵染的健康叶片。 lesion:病斑截图。 res 2022-02-26 生物信息学 #生物信息学 #软件使用
使用tidyverse遇到的一个问题 1234567library(tidyverse)iris %>% dplyr::mutate(temp = case_when( Species == "setosa" ~ "lp", TRUE ~ Species )) 报错: 123456Error in `dplyr::mutate()`:! Problem while computing `temp = case_ 2022-11-23 生物信息学 #生物信息学
生物信息学中的文件格式 bam文件 第一列:QNAME: 比对序列的名称。 第二列:FLAG: 比对的类型。paring、strand、 mate strand 等等。不同的数值代表不一样的比对类型。 第三列:RNAME:表示 read 比对的那条序列的序列名称。如果第三列是”*“,则说明这条 read 没有比对上。 第四列:POS。表示 read 比对到 RNAME 这条序列最左边的位置。 第五列:mapping 的质 2021-12-29 生物信息学 #生物信息学
广义线性混合模型操作指南 更新版本: 推荐的资料 https://bookdown.org/roback/bookdown-BeyondMLR/ch-GLMM.html https://m-clark.github.io/mixed-models-with-R/ 文献信息 Harrison X A, Donaldson L, Correa-Cano M E, et al. A brief introduction to 2023-01-25 生物信息学 #生物信息学
CSS基础学习 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210 2023-05-14 生物信息学 #生物信息学
R语言常用Tips 经常要用到R,有些小技巧每次都要去查,比较麻烦,干脆记录一下。 软件安装 安装Rtools: 安装 Rtools4.0,安装包:https://cran.r-project.org/bin/windows/Rtools/ 配置环境 在 RStudio 里面运行以下脚本: 1writeLines('PATH="${RTOOLS40_HOME}\\usr\\bin;${PATH}"', con 2021-01-18 R语言 #R语言