Content sniffing とは

コンテンツスニッフィングは、メディアタイプスニッフィングまたはMIMEスニッフィングとも呼ばれ、バイトストリームの内容を調べて、その中のデータのファイル形式を推測しようとします。コンテンツスニッフィングは、通常、ファイルを正しく解釈できるようにするために必要となる正確なメタデータの不足を補うために使用されます。コンテンツスニッフィング手法では、ファイルシグネチャとマジックナンバーの検索、よく知られている代表部分文字列の検索、バイト頻度とnグラムテーブルの使用を含むヒューリスティックなど、ほとんどのファイル形式に見られる冗長性に依存するテクニックが使用される傾向があります。 、ベイジアン推論などがある。
MIMEスニッフィングは、WebコンテンツのMIMEタイプを正しく表示しないWebサイトを正しく表示するために、MicrosoftのInternet Explorerなどの一部のWebブラウザで正しく使用されていました。しかし、これにより深刻なセキュリティ上の脆弱性が発生し、MIMEスニッフィングアルゴリズムを混乱させることで、ブラウザを操作してデータを解釈し、攻撃者がサイト運営者またはクロスサイトスクリプティングのような、さらに、MIMEタイプをコンテンツに正しく割り当てないサイトをこれらのブラウザで正しく動作させるようにすることで、コンテンツの正しいラベル付けを奨励することができず、これらのサイトが動作するのに必要なコンテンツスニッフィングが行われ、 Web標準とセキュリティのベストプラクティスとの非互換性。
セキュリティの要件とMIMEタイプのデータの欠落または不正確なWebコンテンツとの逆互換性の必要性とのバランスを取ろうとする、HTML5のメディアタイプの盗聴に関する仕様が存在します。明確で明確な振る舞いを実装するために実装全体で使用できる正確な仕様を提供しようとします。
UNIXファイルコマンドは、コンテンツスニッフィングアプリケーションと見なすことができます。