Failure transparency とは

分散システムでは、障害の透過性とは、システム内のホストやサービスのエラーやその後の復旧がユーザーやアプリケーションに見えない程度を指します。たとえば、サーバーに障害が発生してもユーザーが自動的に別のサーバーにリダイレクトされ、その障害に気付かれない場合、システムは高い障害透過性を発揮します。
障害の透過性は、サーバが実際に障害を起こしたかどうか、または単に非常にゆっくりと応答しているかどうかを判断することが困難な場合が多いため、最も難しい透明性のタイプの1つです。さらに、ネットワークが信頼できないため、分散システムで完全な障害の透過性を達成することは一般的に不可能です。
通常は、高いレベルの障害の透過性を達成し、適切なレベルのシステム性能を維持することとの間にトレードオフがあります。たとえば、クライアントが障害の発生したサーバーに複数回接続しようとすると、分散システムが一時的なサーバー障害をマスクしようとすると、システムのパフォーマンスが悪影響を受ける可能性があります。この場合、前にあきらめて別のサーバーを試してみるのが望ましいでしょう。