每月初,创腾科技生命科学模拟技术部都会通过微信公众号定期总结 biovia 用户在软件使用过程中产生的一些具有代表性的问题。基于我们的工程师团队在分子模拟领域内十多年的经验,定期为大家带来实实在在的技术干货分享。
本月的技术干货q&a分享我们将给大家带来在ds中使用正则表达式选择蛋白中的氨基酸的小技巧,可以极大的方便我们来有目的批量选择氨基酸。
菜单-edit-select ...打开菜单,如下图设置,选择正则表达式:t.r..
根据正则表达式的规则,点可以代表一个字符,比如字母或数字,因此,t.r..中前三个字符代表氨基酸名中第一个字母是t,第二个字母不定,第三个字母为r的氨基酸,这样就只有thr和tyr,r后面点的个数代表了数字的位数,如果是100号之前,则r之后只有两个数字,所以是两个点,点击apply后可以看到,蛋白中序号为两位数的tyr和thr被选中了。依次类推,如果选择序号为个位数的,可以使用t.r.来匹配,当然前提是蛋白结构中10号之前得有相应氨基酸,否则是选不上的。部分正则匹配规则如下:
同样,如果寻找序列号在10-19之间的t.r类氨基酸可以使用t.r1.来匹配查找,具体其它正则表达式大家有兴趣可以自己探索一下。