FASTA フォーマット, fasta ファイル
FASTA フォーマットは,塩基配列やアミノ酸配列を解析するためのテキスト形式を基本としたフォーマットである。Python, Ruby, Perl などのスクリプト言語と相性がよい。
以下のように,
>Name1 Additional informations (optional) >Name2 Additional informations (optional) |
FASTA は「ファスタ」ではなく「ファストエー」と読み,意味するところは fast-all である。all は塩基,タンパク質両方という意味で,FASTA は FASTP (protein) と FASTN (nucleotide) の両方を含む概念である。
FASTA ファイルの拡張子
FASTA 形式で記述された配列のファイルは,FASTA ファイルと呼ばれる。以下のように,様々な拡張子が使われるため最初は混乱するが,
拡張子 | 意味 |
.fasta, .fas, .fa, .fsa, .seq | とくに内容を指定しない (付加情報を示していない) fasta ファイル |
.fna | 塩基配列の fasta ファイル |
.ffn | ゲノムの翻訳領域 coding region を含む fasta ファイル |
.faa | アミノ酸配列の fasta ファイル。 |
.mpna | 複数のアミノ酸配列から成る fasta ファイル |
.frn | Non-coding RNA の fasta ファイル |