Horizontal correlation とは

水平相関は、遺伝子配列分析のための方法論である。 1つの特定の技術を参照するのではなく、水平相関は、2つの特定のテーマによって統一された配列分析に対する様々なアプローチを包含する。
 配列分析は、単一の遺伝子配列の長さに沿って水平に比較することによって行われる。これは、いくつかの異なる遺伝子配列を比較する垂直方法とは対照的である。比較は、一般に、シーケンスの2つの領域間の相互情報関数の値などの情報理論量を測定する。
水平相関アプローチのコアアイデアは、Grosse、Herzel、Buldyrev、Stanley(Grosse、et al。2000)の2000年の論文に最初に示された。この第1の製剤では、Grosseらは、配列をコード領域および非コード領域に分けることによって大きな遺伝子配列を特徴づけようとした。コーディング対ノンコーディングの問題に対する伝統的なアプローチは、一般に、小さな入力で最初に訓練され、シーケンス全体にわたって実行される洗練されたパターン認識システムに基づいていましたが(Ohler、et al。1999)、Grosseの水平相関アプローチ同僚たちは代わりに、その配列を長さが500塩基対だけである比較的短い配列断片に分割することによって働いた。彼らは、これらの断片のそれぞれを、コーディングまたは非コーディングのいずれかとして特徴づけようとしました。これは、断片の長さに沿った各サイズ3のウインドウを、その断片における第1のサイズ3のウインドウと比較し、次いで、2つのウインドウ間の相互情報関数の値を測定することによって達成された。コード配列は、非コード配列が示さなかった3周期性の定型化パターンを示すことが見出された。そのようなパターンは認識が容易であり、コード領域の種間非依存性同定がより迅速かつより多く可能になった(Grosse、et al。2000)。
2000年以降、遺伝子配列の長さに沿った情報理論量の測定を重視した水平相関法が普及し、ショットガンシーケンシングフラグメントアセンブリ(Otu&Sayood、2004)にも応用されている。