SAM (file format) とは

配列アラインメントマップ(SAM)は、Heng LiおよびBob Handsakerらによって開発された参照配列に整列した生物学的配列を保存するためのテキストベースのフォーマットである。これは、次世代シーケンシング技術によって生成されたヌクレオチド配列などのデータを保存するために広く使用されています。このフォーマットは、異なるシーケンシングプラットフォームによって生成された短く長い読み取り(最大128Mbp)をサポートし、ゲノム解析ツールキット(GATK)内、およびBroad Institute、Wellcome Sanger Institute、および1000ゲノムプロジェクト全体にわたってマッピングされたデータを保持するために使用されます。ヌクレオチド配列の配列決定(例えば、配列決定読み取り)から(a)参照配列への配列アラインメント/マップ(SAM)フォーマット。ベースコールとアライメントの品質とその他のデータを含むことができます。