Pose (computer vision) とは

コンピュータビジョンおよびロボットでは、典型的なタスクは、画像内の特定のオブジェクトを識別し、いくつかの座標系に対する各オブジェクトの位置および向きを決定することです。この情報は、例えば、ロボットが物体を操作することを可能にしたり、物体に移動するのを避けるために使用することができる。位置と方向の組み合わせは、オブジェクトの姿勢と呼ばれますが、この概念は方向を記述するためだけに使用されることもあります。外向きと平行移動は、ポーズの同義語としても使用されます。
物体の姿勢が決定される画像データは、単一の画像、ステレオ画像対、または典型的にはカメラが既知の速度で移動している画像シーケンスのいずれかとすることができる。考えられる対象は、生きている部分または身体部分(例えば、頭または手)を含む、かなり一般的であり得る。しかしながら、オブジェクトの姿勢を決定するために使用される方法は、通常、オブジェクトのクラスに固有であり、一般に他のタイプのオブジェクトに対してうまく動作するとは期待できない。
ポーズは、オブジェクトを参照ポーズから観測ポーズに移動させる回転および平行移動変換によって記述することができる。この回転変換は、異なる方法、例えば、回転行列または四元数として表すことができる。