【技術】データ匿名化ではプライバシーの十分な保護を図れないかもしれない
Nature Communications
2019年7月24日
Technology: Data anonymization may be inadequate to protect privacy
不完全な匿名化データセットから個人が再特定化されるかどうかを評価する方法を示した論文が、今週掲載される。この論文は、個人のプライバシーを保護し、あるいはEU一般データ保護規則などのデータ保護法に定める要件を満たすためには、現在のデータ匿名化とデータ共有の方法では不十分である可能性を示唆している。
データサイエンスと人工知能は、医学と医療、ビジネス、ガバナンスなど、私たちの生活のさまざまな側面を一変させると期待されているが、大量の個人レベルの詳細データに依存しており、その収集と共有については、個人のプライバシーに関する懸念が生じている。データの匿名化とデータセットの一部公表は、プライバシー侵害の懸念への取り組みとして実施されてきたが、最近になって閲覧履歴、携帯電話、クレジットカードの各データを含む匿名化データセットの再特定化が成功し、こうした取り組みが不十分である可能性が示されている。
今回、Yves-Alexandre de Montjoyeたちの研究グループは、匿名化データセットから個人が正確に再特定化される可能性を正確に評価できるようにする統計的方法を開発した。これにより、たとえデータセットが不完全であっても、郵便番号、生年月日、性別、子どもの数などの属性がいくつか分かれば、個人の再特定化を高い信頼度で行うために十分となる場合が多いことが明らかになった。判明している属性の数が増えると、再特定化できる可能性が一気に大きくなる。例えば、米国マサチューセッツ州の人口の99.98%が、15種の人口統計学的属性を用いて特定できることが分かった。従って、著者たちは、サンプリングされたデータセットや部分データセットだけを公表する方法では、個人のプライバシー保護に十分でないと結論している。
doi: 10.1038/s41467-019-10933-3
注目の論文
-
3月4日
天文学:宇宙における水の初期の証拠Nature Astronomy
-
2月28日
考古学:ベスビオ火山の火山灰雲が脳をガラスに変えたScientific Reports
-
2月27日
量子コンピューティング:キャット・コードが量子エラーを訂正し、オーバーヘッドを削減するNature
-
2月27日
気候変動:AMOC(大西洋子午面循環)は将来の温暖化に耐えられるかもしれないNature
-
2月26日
惑星科学:火星に固体の内核が存在する可能性Nature Communications
-
2月20日
コンピューターサイエンス:AIツールが創造的なビデオゲーム開発を支援Nature