Homology modeling とは

タンパク質の比較モデリングとしても知られる相同性モデリングは、そのアミノ酸配列および関連する相同タンパク質(「テンプレート」)の実験的な三次元構造から「標的」タンパク質の原子分解モデルを構築することを指す。相同性モデリングは、クエリー配列の構造に似ている可能性のある1つ以上の既知のタンパク質構造の同定、およびクエリー配列中の残基をテンプレート配列中の残基にマップするアラインメントの生成に依存する。タンパク質構造は同族体の中でタンパク質配列よりも保存されているが、20%の配列同一性を下回る配列は非常に異なる構造を有することが示されている。
進化的に関連するタンパク質は類似の配列を有し、天然に存在する相同タンパク質は類似のタンパク質構造を有する。 3次元タンパク質構造は、配列保存のみに基づいて予想されるよりも進化的に保存されていることが示されている。
次いで、配列アライメントおよびテンプレート構造を使用して、標的の構造モデルを作製する。タンパク質構造はDNA配列よりも保存されているので、配列類似性の検出可能なレベルは、通常、顕著な構造的類似性を意味する。
相同性モデルの品質は、配列アラインメントおよび鋳型構造の品質に依存する。このアプローチは、標的には存在するが鋳型には存在しない構造領域を示すアライメントギャップ(通常はindelsと呼ばれる)の存在によって複雑化することができ、実験手順(通常はX -ray crystallography)を使用して、構造を解く。モデルの品質は、配列同一性が低下するにつれて低下する。典型的なモデルは、70%の配列同一性で一致したCα原子の間に〜1-2Åの二乗平均平方根偏差を有するが、25%の配列同一性では2〜4Åの一致しか有さない。しかし、標的タンパク質と鋳型タンパク質のアミノ酸配列が完全に異なる可能性があるループ領域では、誤差が有意に高い。
通常、ループモデリングによってテンプレートなしで構築されたモデルの領域は、一般にモデルの他の部分よりもはるかに正確ではありません。側鎖のパッキングおよび位置の誤りも同一性が減少するにつれて増加し、これらのパッキング構成の変動は、低い同一性での劣悪なモデル品質の主な理由として示唆されている。まとめると、これらの様々な原子位置誤差は重大であり、薬物設計およびタンパク質 – タンパク質相互作用予測などの原子分解能データを必要とする目的のための相同性モデルの使用を妨げる。タンパク質の4次構造であっても、そのサブユニットの相同性モデルから予測することは困難であり得る。それにもかかわらず、相同性モデルはクエリー配列の生化学に関する定性的結論、特に特定の残基が保存されている理由についての仮説を立てる際に有用であり、これらの仮説を試験する実験につながる可能性がある。例えば、保存された残基の空間配置は、折りたたみを安定化させるために、特定の残基が保存されているかどうか、またはいくつかの小分子に結合するために、あるいは別のタンパク質または核酸との会合を促進するために、
相同性モデリングは、標的と鋳型が密接に関連している場合に高品質の構造モデルを生成することができ、これはタンパク質折り畳みのすべてのクラスの代表的な実験構造の作製に特化した構造ゲノムコンソーシアムの形成を促した。より低い配列同一性で悪化する相同性モデリングにおける主要な不正確さは、初期配列アラインメントおよび不適切なテンプレート選択のエラーに由来する。構造予測の他の方法と同様に、相同性モデリングにおける現在の実践は、タンパク質構造予測技術の重要な評価(CASP)として知られる2年規模の大規模実験で評価される。