Recursive XY-cut とは

再帰的X-Yカットは、文書画像を再帰的に一連の矩形ブロックに分解するトップダウンページセグメンテーション技術である。このアルゴリズムは、ドキュメントビットマップを(すなわち、ライン内のすべてのピクセルを合計して)ドキュメントページの辺に投影することによって機能する。この方法では、空白の密度のグラフが生成され、垂直または水平の空白行のピークがあります。これらのピークは、文書のカットを定義し、文書をより小さな断片に分割するためにトップダウンで使用されます。