小编给大家分享一下perl如何提取进化树中基因的顺序,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

提取进化树中基因的顺序

进化树中基因是有顺序的,有些时候我们会需要用到这个基因列表,如果,手动来做就会比较麻烦。哪有什么快速的方法吗?

其实有的,进化树的nwk文件中就有基因的顺序:如下:

(chicken,((mouse,rat),(chimp,human)));

能够发现图中枝的顺序就是nwk文件中的顺序,这样我们只需要提取这个顺序即可。这里我写了一个脚本,如下:

用法:

perlnwk_geneid.pl-iin.nwk-oout.txt

in.nwk 为输入的nwk文件,out.txt是输出的基因ID文件。

脚本代码;

useGetopt::Long;usestrict;my%opts;GetOptions(\%opts,"i=s","o=s","h");open(IN,"$opts{i}")||die"open$opts{i}failed\n";open(OUT,">$opts{o}")||die"open$opts{o}failed\n";while(<IN>){chomp;my$str=$_;$str=~s/\d\.\d+//g;$str=~s/\(//g;$str=~s/\)//g;$str=~s/://g;$str=~s/;//g;my@line=split(",",$str);printOUTjoin("\n",@line);}close(IN);close(OUT);

以上是“perl如何提取进化树中基因的顺序”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!