Biclustering とは

バイクラスタリング、ブロッククラスタリング、コクラスタリング、または2モードクラスタリングは、マトリックスの行と列の同時クラスタリングを可能にするデータマイニング技術です。この用語はBoris Mirkinによって、1972年にJ. A. Hartiganによって何年も前に紹介された技術の名称に最初に導入されました。
n {\displaystyle n} 次元フィーチャベクトルによって表される1組のサンプル m {\displaystyle m} が与えられると、データセット全体は n {\displaystyle n} 列(すなわち m × n {\displaystyle m\times n} 行列)の m {\displaystyle m} 行として表すことができる。 biclusteringアルゴリズムはbiclustersを生成します。biclustersは、列のサブセットで同様の動作を示す行のサブセットです。