Feature extraction とは

機械学習、パターン認識、および画像処理において、特徴抽出は、測定データの初期セットから開始し、有益かつ非重複であることを意図した派生値(特徴)を構築し、その後の学習および一般化ステップを促進し、より良い人間の解釈に。フィーチャ抽出は、次元削減に関連しています。
アルゴリズムへの入力データが処理するには大きすぎて冗長であると思われる場合(例えば、足とメートルの両方で同じ測定値、またはピクセルとして提示された画像の反復性)、それは縮小されたセット特徴(特徴ベクトルとも呼ばれる)の数初期特徴のサブセットを決定することは、特徴選択と呼ばれる。選択されたフィーチャは、入力データからの関連情報を含むことが期待されるので、完全な初期データの代わりにこの縮小された表現を使用して所望のタスクを実行することができる。