「mitotools」从细胞器genbank文件中快速提取序列

Fast sequence extraction from organelle genbank files

Posted by 云伴风行 on June 16, 2024

细胞器基因组分析相关脚本添加新的功能get_seq,该脚本由C编写,可以快速根据细胞器基因组的gb文件提取注释序列。我觉得这是一个比较实用的功能,当我们做进化分析时,批量下载gb文件,然后使用get_seq批量获取cds和pep序列,拒绝点点点 :)

使用说明

  • get_seq

    get_seq can be used to quickly extract annotated sequences from genbank files of mitochondrial genomes such as faa, cds, pep, trn, rrn.

    Run get_seq --help to show the program’s usage guide.

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    
    Usage:./get_seq -g <genbank_file> -a
    Required options:
       -g, --genbank  Intput genbank file
    Optional options:
       -pre, --prefix  Prefix of the output
       -a, --all    Flag to output all annotations
       -f, --faa    Flag to output fasta
       -p, --pep    Flag to output pep
       -c, --cds    Flag to output cds
       -t, --trn    Flag to output trn
       -r, --rrn    Flag to output rrn
       -o, --output The output path
       -h, --help      Display this help message
      
    

输出结果

1
2
3
4
5
6
7
8
9
$ ./get_seq -g PPtest.gb -a -o ./
[2024-06-16 22:08:45] INFO: The genbank file: PPtest.gb
[2024-06-16 22:08:45] INFO: The prefix: PPtest
[2024-06-16 22:08:45] INFO: The output path: ./
[2024-06-16 22:08:45] INFO: CDS sequences saved to ./PPtest.cds
[2024-06-16 22:08:45] INFO: rRNA sequences saved to ./PPtest.rrn
[2024-06-16 22:08:45] INFO: tRNA sequences saved to ./PPtest.trn
[2024-06-16 22:08:45] INFO: Pep sequences saved to ./PPtest.pep
[2024-06-16 22:08:45] INFO: Faa sequences saved to ./PPtest.faa

直接下载编译后的文件get_seq就可以使用,如果有其他想要实现的功能,可以在mitotools告诉我们。

© 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!