Audio-visual speech recognition とは

オーディオビジュアル音声認識(AVSR)は、唇の読み取りにおける画像処理能力を使用して、音声認識システムが未定義の電話を認識するのを助けるか、または近い確率の決定の中で優勢を与える技術である。
唇の読み取りと音声認識の各システムは別々に動作し、その結果は機能融合の段階で混合されます。