Root-mean-square deviation of atomic positions とは

バイオインフォマティクスでは、原子位置の二乗平均平方根偏差(または単に平方根二乗偏差RMSD)は、重ね合わされたタンパク質の原子間の平均距離(通常は骨格原子)の尺度です。 RMSD計算は、小さな有機分子などの他の非タンパク質分子にも適用できることに注意してください。球状タンパク質立体配座の研究では、慣習的に、最適剛体重畳後のCα原子座標のRMSDによる3次元構造における類似性を測定する。
動的システムが明確に定義された平均位置の周りで変動する場合、時間に対する平均からのRMSDは、RMSFまたは二乗平均平方根変動と呼ばれることがあります。この変動の大きさは、例えばメスバウアー分光法または核磁気共鳴を用いて測定することができ、重要な物理的情報を提供することができる。 Lindemannインデックスは、システムのパラメータのコンテキストでRMSFを配置する方法です。
生体分子または固体の構造を比較するために広く使用されている方法は、一方の構造を他方の構造に対して平行移動および回転させてRMSDを最小化することである。 Coutsias、et al。 2組のベクトル間のRMSDを最小にする最適なソリッドボディ変換(回転変換)のために、クォータニオンに基づく簡単な導出を示しました。彼らは、四元数法がよく知られているKabschアルゴリズムと同等であることを証明しました。 Kabschによって与えられた解は、HurleyとCattellによって導入されたd次元問題の解のインスタンスです。最適回転を計算するための四元数解はPetitjeanの論文の付録に掲載されました。この四元数解とd次元の場合の最適アイソメトリの計算は、ペティジャンの他の論文の付録Aの無限集合と連続事例の両方に拡張された。

RefDB (chemistry) とは

再参照されたタンパク質化学シフトデータベース(RefDB)は、BioMagResBank(BMRB)(図1)に由来する、慎重に補正または再参照された化学シフトのNMR分光データベースである。以前に割り当てられたタンパク質のX線またはNMR座標データから予想されるタンパク質(1)H、(13)Cおよび(15)N化学シフトを計算するために、構造ベースの化学シフト計算プログラム(SHIFTXと呼ばれる) BMRBで報告されている。比較はSHIFTCORというプログラムによって自動的に行われます。 RefDBデータベースは現在、2000を超える割り当てられたペプチドおよびタンパク質について、参照補正された化学シフトデータを提供している。データベースからのデータは、(13)Cタンパク質割り当てを有するBMRBエントリーの約25%および(15)Nタンパク質割り当てを有するBMRBエントリーの27%が、有意な化学シフト参照再調整を必要とすることを示す。さらに、BioMagResBankに寄託されたタンパク質エントリーのほぼ40%は、少なくとも1つの割り当てエラーを有するように見える。ユーザーは、RefDB Webサイトから入手可能ないくつかの方法でデータベースをダウンロード、検索、または閲覧することができます。 RefDBは、生体分子NMR分光法の標準的な化学シフトリソースを提供し、ペプチドおよびタンパク質の化学シフト傾向を導出または計算したいと考えています。

Threading (protein sequence) とは

フォールド認識とも呼ばれるタンパク質の糸通しは、既知の構造のタンパク質と同じ折り畳みを有するが、既知の構造を有する同種タンパク質を有さないタンパク質をモデル化するために使用されるタンパク質モデリングの方法である。構造予測の相同性モデリング方法とは異なり、タンパク質データバンク(PDB)に同族のタンパク質構造を持たないタンパク質に対しては(タンパク質スレッディング)が使用され、ホモロジーモデリングはタンパク質に使用されます。スレッディングは、PDBに寄託された構造と、モデル化したいタンパク質の配列との間の関係の統計的知識を使用することによって作用する。
予測は、標的配列中の各アミノ酸を鋳型構造中の位置に「貫通(threading)」(すなわち配置、整列)させ、標的がどれくらい鋳型に適合するかを評価することによって行われる。最適なテンプレートが選択された後、シーケンスの構造モデルは、選択されたテンプレートとの位置合わせに基づいて構築されます。タンパク質の糸通しは、2つの基本的な観察に基づいています。性質の異なる折り畳みの数はかなり少なく(約1300)です。過去3年間にPDBに提出された新しい構造の90%は、PDBに既に存在するものと同様の構造的な折り畳みを有することが示されている。

Graphical models for protein structure とは

グラフィカルモデルは、タンパク質構造予測、タンパク質 – タンパク質相互作用およびタンパク質構造の自由エネルギー計算のための強力なフレームワークとなっている。グラフィカルモデルを用いてタンパク質構造を表すことにより、二次構造予測、タンパク質タンパク質相互作用、タンパク質 – 薬物相互作用、および自由エネルギー計算を含む多くの問題の解決が可能になる。
タンパク質構造モデリングにおけるグラフィカルモデルの使用には、主に2つのアプローチがあります。第1のアプローチは、タンパク質構造の座標または二面角を表すための離散変数を使用する。変数はもともとすべて連続値であり、それらを離散値に変換するために、離散化プロセスが通常適用される。 2番目のアプローチでは、座標または2面角に連続変数を使用します。

Chemical shift index とは

化学シフトインデックスまたはCSIは、タンパク質核磁気共鳴分光法において、タンパク質の二次構造(ベータ鎖、ヘリックスおよびランダムコイル)のタイプ(ならびに開始および終了)を表示および同定するために使用することができる広く用いられている技術であるこの技術は、1Hα化学シフトを分析するために1992年にDavid Wishart博士によって発明され、その後、13Cバックボーンシフトを組み込むために1994年に彼によって延長された。元のCSI法は、ヘリックス中のアミノ酸残基の1Hα化学シフトが、それらのランダムコイル値およびダウンフィールド(すなわち、NMRスペクトルの右側に向かって)に対してアップフィールド(すなわちNMRスペクトルの右側に向かって)シフトされる傾向があるという事実を利用するNMRスペクトル)を示す。同様の種類のアップフィー/ダウンファイル傾向も、バックボーン13C化学シフトで検出可能である。

Homology modeling とは

タンパク質の比較モデリングとしても知られる相同性モデリングは、そのアミノ酸配列および関連する相同タンパク質(「テンプレート」)の実験的な三次元構造から「標的」タンパク質の原子分解モデルを構築することを指す。相同性モデリングは、クエリー配列の構造に似ている可能性のある1つ以上の既知のタンパク質構造の同定、およびクエリー配列中の残基をテンプレート配列中の残基にマップするアラインメントの生成に依存する。タンパク質構造は同族体の中でタンパク質配列よりも保存されているが、20%の配列同一性を下回る配列は非常に異なる構造を有することが示されている。
進化的に関連するタンパク質は類似の配列を有し、天然に存在する相同タンパク質は類似のタンパク質構造を有する。 3次元タンパク質構造は、配列保存のみに基づいて予想されるよりも進化的に保存されていることが示されている。
次いで、配列アライメントおよびテンプレート構造を使用して、標的の構造モデルを作製する。タンパク質構造はDNA配列よりも保存されているので、配列類似性の検出可能なレベルは、通常、顕著な構造的類似性を意味する。
相同性モデルの品質は、配列アラインメントおよび鋳型構造の品質に依存する。このアプローチは、標的には存在するが鋳型には存在しない構造領域を示すアライメントギャップ(通常はindelsと呼ばれる)の存在によって複雑化することができ、実験手順(通常はX -ray crystallography)を使用して、構造を解く。モデルの品質は、配列同一性が低下するにつれて低下する。典型的なモデルは、70%の配列同一性で一致したCα原子の間に〜1-2Åの二乗平均平方根偏差を有するが、25%の配列同一性では2〜4Åの一致しか有さない。しかし、標的タンパク質と鋳型タンパク質のアミノ酸配列が完全に異なる可能性があるループ領域では、誤差が有意に高い。
通常、ループモデリングによってテンプレートなしで構築されたモデルの領域は、一般にモデルの他の部分よりもはるかに正確ではありません。側鎖のパッキングおよび位置の誤りも同一性が減少するにつれて増加し、これらのパッキング構成の変動は、低い同一性での劣悪なモデル品質の主な理由として示唆されている。まとめると、これらの様々な原子位置誤差は重大であり、薬物設計およびタンパク質 – タンパク質相互作用予測などの原子分解能データを必要とする目的のための相同性モデルの使用を妨げる。タンパク質の4次構造であっても、そのサブユニットの相同性モデルから予測することは困難であり得る。それにもかかわらず、相同性モデルはクエリー配列の生化学に関する定性的結論、特に特定の残基が保存されている理由についての仮説を立てる際に有用であり、これらの仮説を試験する実験につながる可能性がある。例えば、保存された残基の空間配置は、折りたたみを安定化させるために、特定の残基が保存されているかどうか、またはいくつかの小分子に結合するために、あるいは別のタンパク質または核酸との会合を促進するために、
相同性モデリングは、標的と鋳型が密接に関連している場合に高品質の構造モデルを生成することができ、これはタンパク質折り畳みのすべてのクラスの代表的な実験構造の作製に特化した構造ゲノムコンソーシアムの形成を促した。より低い配列同一性で悪化する相同性モデリングにおける主要な不正確さは、初期配列アラインメントおよび不適切なテンプレート選択のエラーに由来する。構造予測の他の方法と同様に、相同性モデリングにおける現在の実践は、タンパク質構造予測技術の重要な評価(CASP)として知られる2年規模の大規模実験で評価される。

CAFASP とは

CAFASP、または完全自動構造予測の重要な評価は、タンパク質構造予測の大規模なブラインド実験であり、ホモロジーモデリング、フォールド認識、およびタンパク質立体構造のab initio予測における自動構造予測ウェブサーバーのパフォーマンスを、アミノ酸配列。この実験は、人間の介入と専門知識を組み込んだ予測に焦点を当てたCASPと並行して、2年に1回実行されます。 CAFASPは、Protein Data Bankに新たに導入されたタンパク質構造に対して週に1回実行される関連ベンチマーク手法であるLiveBenchとEVAと比較すると、はるかに少ないデータを生成しますが、人間の予測専門家によって生成された予測と直接比較できる予測が得られます。最近CAFASPは、別の実験としてではなく、CASP結果に基本的に統合されて実行されています。

De novo protein structure prediction とは

計算上の生物学において、デノボタンパク質構造予測は、タンパク質三次構造がそのアミノ酸一次配列から予測されるアルゴリズムプロセスを指す。この問題自体は未だ解決されずに数十年にわたり有力な科学者を占めていた。サイエンスによると、この問題は、現代科学における上位125の顕著な問題の1つである。現在、最も成功した方法のいくつかは、構造全体にわたって1.5オングストローム以内の小さな単一ドメインタンパク質の折り畳みを予測する妥当な確率を有する。
新規の方法は膨大な計算資源を必要とする傾向があり、比較的小さなタンパク質に対してのみ実施されている。デノボタンパク質構造モデリングは、対象とするタンパク質に対する相同性の問題がないので、アミノ酸配列からタンパク質構造を予測することが非常に困難であるという事実により、テンプレートベースのモデリング(TBM)とは区別される。より大きいタンパク質のための新しいタンパク質構造の予測には、強力なスーパーコンピュータ(Blue GeneやMDGRAPE-3など)や分散コンピューティングプロジェクト(Folding @ home、Rosetta @ home、ヒトプロテオームフォールディングプロジェクト、または世界のための栄養価の高いライス)。計算上の障壁は膨大であるが、構造ゲノミクス(予測または実験方法による)のメディカルやドラッグデザインなどの潜在的な利点は、新規構造予測を積極的な研究分野にしている。

Protein subcellular localization prediction とは

タンパク質の細胞内局在予測(またはちょうどタンパク質の局在予測)は、タンパク質が細胞内のどこに存在するか、その細胞内局在を予測することを含む。
一般に、予測ツールは、タンパク質のアミノ酸配列などのタンパク質に関する情報を入力として取り込み、核、小胞体、ゴルジ体、細胞外空間、または他の細胞小器官などの出力として細胞内の予測される位置を生成する。目的は、細胞内のタンパク質標的化の結果を正確に予測できるツールを構築することです。
タンパク質の細胞内局在の予測は、タンパク質機能およびゲノム注釈のバイオインフォマティクスに基づく予測の重要な要素であり、薬物標的の同定を助けることができる。

List of Protein subcellular localization prediction tools とは

タンパク質の細胞内局在予測ツールのこのリストには、タンパク質の細胞内局在予測に使用されるソフトウェア、データベース、およびウェブサービスが含まれる。
シグナルペプチドや膜貫通ヘリックスのような予測された構造特性によって位置を推定するために一般的に使用されるツールが含まれており、これらのツールは特定の場所ではなくこれらの機能の予測を出力します。タンパク質構造予測に関連するこれらのソフトウェアはまた、タンパク質構造予測ソフトウェアのリストに現れ得る。