Multiple EM for Motif Elicitation とは

複数のEM for Motif Elicitation(MEME)は、関連するDNA配列またはタンパク質配列のグループのモチーフを発見するためのツールです。
モチーフは、関連するタンパク質またはDNA配列のグループにおいて繰り返し発生し、しばしばいくつかの生物学的機能に関連する配列パターンである。 MEMEは、モチーフを、パターンの各位置で可能な各文字の確率を記述する位置依存文字確率行列として表現する。個々のMEMEモチーフにはギャップがありません。可変長ギャップを有するパターンは、MEMEによって2つ以上の別個のモチーフに分割される。
MEMEは、DNAまたはタンパク質配列(トレーニングセット)のグループを入力として受け取り、要求されたモチーフを出力します。それは、統計モデリング技術を使用して、各モチーフの最適な幅、発生数、および記述を自動的に選択します。
MEMEは、MEMEスイートと呼ばれるモチーフを分析するためのツールのコレクションの中で最初のものです。