Datafly algorithm とは

Dataflyアルゴリズムは、医療データに匿名性を提供するためのアルゴリズムです。このアルゴリズムは、Latanya Arvette Sweeneyによって1997-98年に開発されました。匿名化は、データ内に見つかった詳細の多くを失わずに、情報を適切に自動的に一般化、置換、挿入、削除することによって実現されます。この方法は、施設内のロールベースのセキュリティではオンザフライで、施設からのデータのエクスポートにはバッチモードで使用できます。組織は、結果のデータが匿名に見えるため、患者の機密性が維持されていると誤って信じて、名前のような明示的な識別子をすべて使用して医療データを公開し、受信します。しかし、残りのデータは、データを他のデータベースにリンクまたはマッチングすることによって、またはデータベース自体のフィールドおよび記録に見られる独特な特性を調べることによって、個人を再識別するために使用され得る。
Dataflyアルゴリズムは、過大化によって匿名化を達成しようとしたことで批判されています。アルゴリズムは、最初に一般化するものとして、最大数の異なる値を持つ属性を選択します。