Dual modular redundancy とは

信頼性エンジニアリングでは、システムのコンポーネントが複製され、障害が発生した場合に備えて冗長性を提供することで、デュアルモジュール冗長性(DMR)が実現されます。特に、フォールトトレラントのコンピュータシステムにおいて、複製されたコンポーネントが並行して動作するシステムに適用されます。典型的な例は、複製されたノードを有する複雑なコンピュータシステムである。そのため、1つのノードが故障しても、別のノードがその作業を実行する準備ができているはずである。
DMRは、1つのコンポーネントの障害に対して堅牢性を提供し、同じ結果をもたらすはずの計測器またはコンピュータが異なる結果をもたらすが、誤ったコンポーネントが正しく、誤動作していると自動的に判断できないエラー訂正を提供しません。このエフェクトには、「2つのクロノメーターで決して海に行ってはならない、1つまたは3つを取る」という古い格言があります。意味は、2つのクロノメーターが矛盾する場合、どちらが正しいかをどのように知っていますか?
ロックステップ・フォールト・トレラント・マシンは、並列に動作する複製された要素を使用します。いつでも、各要素のすべての複製が同じ状態にある必要があります。同じ入力が各レプリケーションに提供され、同じ出力が期待されます。レプリケーションの出力は、投票回路を使用して比較されます。各要素の2つの複製を持つマシンは、デュアルモジュール冗長(DMR)と呼ばれます。したがって、投票回路は、不一致を検出することしかできず、回復は他の方法に依存する。例には1ESSスイッチがあります。
各要素の3つの複製を持つマシンは、3重モジュール冗長(TMR)と呼ばれます。投票回路は、2対1の投票が観察されたときに、どの複製に誤りがあるかを判定することができる。この場合、投票回路は正しい結果を出力し、誤ったバージョンを破棄することができる。その後、間違ったレプリケーションの内部状態は他の2つとは異なるとみなされ、投票回路はDMRモードに切り替えることができる。このモデルは、より多数のレプリケーションに適用できます。