Semantic compression とは

自然言語処理では、意味圧縮は、テキストセマンティクスを維持しながら、言語の異質性を低減することによって、テキスト文書(または文書セット)を構築するために使用される辞書を圧縮するプロセスである。その結果、より小さな単語セットを使用して同じアイデアを表現することができます。
セマンティック圧縮は不可逆圧縮です。つまり、一部のデータが破棄され、元のドキュメントを逆のプロセスで再構築することはできません。