关于DSSP的安装教程有很多,方式也不尽相同,这里我介绍一种个人觉得最便利的方法,通过anaconda安装相关库: conda install -c ostrokach dssp 注意这种安装方式仅仅是在linux环境上才生效,关于windows下利用anaconda进行安装的方法并不是很清楚,感兴趣的可自行百度。github 上下载源码进行安装:…
一、Protein Data Bank 蛋白质数据库(Protein Data Bank,简称PDB)是一个专门收录蛋白质及核酸的三维构资料的数据库。由Worldwide Protein Data Bank监管。PDB可以经由网络免费访问,是结构生物学研究中的重要资源。为了确保PDB资料的完备与权威,各个主要的科学杂志、基金组织会要求科学家将自己的…
一、基本概念 溶剂可及性(solvent accessibility)一般描述为可及表面积(access surface area,ASA)或者是 溶剂可及表面积(solvent-accessibility surface area,SASA),是溶剂可接触的生物分子表面积。 ASA的测量通常以平方埃为单位进行描述(分子生物学中的标准测量单位)…
一、BLAST+下载 在ncbi官网下载压缩包:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/: 根据操作系统选择合适的版本,我使用的服务器版本是64位linux操作系统,则选择ncbi-blast-2.13.0+-x64-linux.tar.gz。可以在本地下载,解压缩后…
POSSUM 网站一共给出了21种PSSM的”变形“,这21种”变形“出自13篇不同的论文,我简单阅读这13篇论文,对各个PSSM做了一个简单的归纳,为了与原始论文中的描述一致,下面描述中采用的PSSM的维数为(蛋白质长度,20),与维基百科正好相反。 一、21种”变形“PSSM POSSUM的原论文: Wang J, Yang B et al. …
[mathjax] 最近应导师要求,需要在POSSUM网站上生成氨基酸序列对应的21种以PSSM为基础的特征,博主本身从未接触过PSSM,因此想记录一下整个学习过程。 一、什么是PSSM PSSM全称是“position-specific scoring matrix”,翻译成中文为“位置特异性打分矩阵”,也称为“位置比重矩阵”。对于氨基酸…
一、DIAMOND安装 DIAMOND用于序列比对,速度比BLAST快不少,安装也比较方便,这里介绍两种安装方式。 Linux命令安装 在linux服务器上,可通过如下命令安装: # 下载压缩文件 wget http://github.com/bbuchfink/diamond/releases/download/v0.9.25/diamond-l…