一、DIAMOND安装

DIAMOND用于序列比对,速度比BLAST快不少,安装也比较方便,这里介绍两种安装方式。

Linux命令安装

在linux服务器上,可通过如下命令安装:

# 下载压缩文件
wget http://github.com/bbuchfink/diamond/releases/download/v0.9.25/diamond-linux64.tar.gz
# 解压文件
tar xzf diamond-linux64.tar.gz
# 有root全新啊
sudo mv diamond /usr/local/bin
# 无root权限, ~/bin是自己当前目录下
mv diamond ~/bin

上述命令参考自博客:DIAMOND: 超快的蛋白序列比对软件。若第一行命令运行缓慢,可以直接去 Github 上下载压缩文件,放到服务器中,接着执行下面的命令。若没有报错,那么DIAMOND就安装成功。

bioconda安装

其实还有更简单的安装方式,就是通过conda来安装,在服务器中执行如下命令:

conda install -c bioconda diamond

前提是你得先安装anaconda。

二、DIAMOND的简单使用

DIAMOND并不具备BLAST的众多功能,其聚焦于序列比对,使用起来也非常简洁。你可以通过help查看有关diamond的相关命令:

diamond help

建库

diamond makedb --in aaa.fa --db nr

这个命令有两个参数:--in 输入蛋白质文件和--db 生成后缀为.dmnd的数据库文件。aaa.fa就是建库需要使用到的蛋白质序列,nr就是数据库名,可以自定义。
比对

diamond blastp --db nr -query bbb.fa -out ab.txt

如果是蛋白质序列比对就是使用blastp,DNA序列比对就是使用blastx。另外这条命令有三个基本参数:nr表示数据库名(根据你建立的数据库而来),bbb.fa(保存查询序列的文件),ab.txt(查询结果输出文件)。

以上就是DIAMOND的安装和简单使用,在以后的使用中若遇到重要的地方再来更新。


一沙一世界,一花一天堂。君掌盛无边,刹那成永恒。