Volcano plot (statistics) とは

統計では、火山プロットは、レプリケートデータで構成される大きなデータセットの変更をすばやく識別するために使用される一種のスキャッタプロットです。それは、それぞれy軸およびx軸の有意差対折りたたみ変化をプロットする。これらのプロットは、ゲノミクス、プロテオミクス、メタボロミクスなどのオミック実験でますます一般的になり、2つの条件の間に何千ものレプリケートデータポイントのリストがあり、最も重要な変更を迅速に特定したいと考えています。火山プロットは、統計的なテスト(例えば、ANOVAモデルからのp値)とその変化の大きさとの統計的有意性の指標を組み合わせることで、大きな変化を示すデータ点(遺伝子など)統計的にも有意である。
火山プロットは、p値の負の対数をy軸(通常は底10)にプロットすることによって作成されます。これにより、プロットの上部に向かってp値が低い(有意性が高い)データポイントが表示されます。 x軸は、2つの条件の間の倍率変化の対数です。フォールドチェンジのログは、両方向の変化が中央から等距離になるように使用されます。この方法でポイントをプロットすると、プロットの2つの関心領域、すなわち、プロットの上部に向かって見いだされる、左または右のいずれかの側にあるポイントが得られます。これらは、大きな振幅倍の変化(したがって、中央の左または右)ならびに高い統計的有意性を示す値を表す(したがって、上に向かっている)。
追加情報は、データの第3の次元(信号強度など)に従って点を着色することによって追加することができるが、これは一様に採用されていない。火山プロットは、正則化の例であるマイクロアレイ(SAM)遺伝子選択基準の有意性分析を図式的に表示するためにも使用される。
火山プロットの概念は、x軸が統計信号の強度の尺度に関連し、y軸が信号の統計的有意性の尺度に関連する他のアプリケーションに一般化することができる。例えば、ゲノムワイド関連研究のような遺伝的関連症例対照研究では、火山プロットの一点は一塩基多型を表す。そのx値はオッズ比であり、y値はカイ二乗検定またはカイ二乗検定統計からのp値の-log10とすることができる。