小蓝哥的知识荒原
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

如何批量从NCBI下载基因组数据

想下载几千个细菌的基因组做泛基因组分析,结果啊总是网络错误下载失败。于是我就搜了搜,发现这个: Genomes Download (FTP) FAQ 发现这个链接的命名非常有规律可循。 那就R语言伺候: 1234567891011121314df.bins.pan.info %>% dplyr::select(`Assembly Accession`, `Assembly Name`
2023-07-06
#生物信息学

Conda安装最新版R

1234conda config --add channels conda-forgeconda config --set channel_priority strictconda search r-baseconda install -c conda-forge r-base=4.1.2 💌lixiang117423@foxmail.com💌lixiang117423@gmail.com
2022-03-28
生物信息学
#生物信息学

Python提取fasta文件成单行文件

R语言对fasta这种超大的字符文件进行处理真的是太慢了,Python是真的香啊!
2021-04-07
Python
#Python

微生物组VSEARCH学习笔记

文献 Rognes T, Flouri T, Nichols B, et al. VSEARCH: a versatile open source tool for metagenomics[J]. PeerJ, 2016, 4: e2584. 安装直接使用mamba安装: 1mamba install bioconda::vsearch 流程常规的扩增子流程: 序列双端合并;去除两端接头,F
2024-02-20
生物信息学
#生物信息学

自动下载校验fastq文件

首先,直接在ENA上检索想要下载的数据,如: 有两个信息很重要,MD5值和Aspera链接。 选择TSV下载格式将信息下载下来,然后使用R进行处理,获得最终要的数据格式。R代码如下: 1234567891011121314151617181920212223rm(list = ls())dir("data/生信挖掘/水稻多效基因/data/ENA下载信息/") %>% as.data.
2024-08-21
生物信息学
#生物信息学

Blossom配置

准备在NAS上折腾的,各种端口开放不方便,直接就用腾讯云服务器折腾吧。。。。。。 安装并运行数据库安装: 1docker pull mysql:8.0.31 运行: 官方模板 123456789101112docker run \-d \--name mysql \#【可选修改】数据库 root 用户的密码 -e MYSQL_ROOT_PASSWORD=jasmine888 \-p 3306:
2023-12-10
生物信息学
#生物信息学

细菌泛基因组分析工具panX

下载安装 Ding W, Baumdicker F, Neher R A. panX: pan-genome analysis and exploration[J]. Nucleic acids research, 2018, 46(1): e5-e5. 我是用mamba安装的: 123mamba create --name panXmamba activate panXmamba insta
2023-07-08
生物信息学
#生物信息学

Kraken taxonomic sequence classification system Version 2.1.3 Operating Manual Table of Contents Introduction System Requirements Installation Kraken 2 Databases Standard Kraken 2 Databa
2025-11-14

Docker配置阿里云镜像

登录阿里云获取专用镜像链接:https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors 修改配置文件 1sudo vi /etc/docker/daemon.json 加入下面的内容: 123{ "registry-mirrors": ["https://xxxxxxx.mirror.aliyuncs.com"]} 💌l
2022-06-19
生物信息学
#生物信息学

R语言自动跳过Error实现循环

经常要批量读取网页文件,有时候URL会报错,循环的程序就断开了,很麻烦。学习到一种tryCatch的方法。 12345678910111213141516171819202122for (i in 1:nrow(kegg.id)) { tryCatch({ Sys.sleep(0.5) KEGGREST::keggGet(kegg.id$id[i]) -> temp
2023-03-02
生物信息学
#生物信息学

分类-回归树(CART)在R语言中的实现

CART 模型 ,即 Classification And Regression Trees。它和一般回归分析类似,是用来对变量进行解释和预测的工具,也是数据挖掘中的一种常用算法。如果因变量是连续数据,相对应的分析称为回归树,如果因变量是分类数据,则相应的分析称为分类树。
2020-12-22
R语言
#R语言

Python英文文献爬虫

之前写过用Python爬取中文文献,但是更多时候需要的是英文文献,就写了个英文的爬虫代码。
2020-01-12
Python
#Python
1…1617181920…27

搜索

Hexo Fluid
滇ICP备2021000708号-4