M-Theory (learning framework) とは

機械学習とコンピュータビジョンでは、M理論は、視覚野の腹側の流れにおけるフィードフォワード処理からインスピレーションを受けた学習フレームワークであり、もともとは視覚的な場面での物体の認識と分類のために開発されました。 M理論は後に音声認識などの他の分野にも適用されました。特定の画像認識タスクでは、M-Theoryの特定のインスタンス化に基づくアルゴリズム、HMAXが人間レベルのパフォーマンスを達成しました。
M-Theoryのコア原理は、画像の様々な変換(翻訳、スケール、2Dおよび3D回転など)に影響されない表現を抽出することです。不変表現を使用する他のアプローチとは対照的に、M-理論では、それらはアルゴリズムにハードコードされていないが、学習されている。 M-理論はまた、圧縮センシングといくつかの原則を共有しています。この理論は、視覚野と同様の多層階層学習アーキテクチャを提案している。