データを暗号化したまま統計解析する秘密計算手法を開発―プライバシーを損なうことなく統計解析可能に:筑波大学ほか
(2017年3月1日発表)
筑波大学のシステム情報系研究者のグループは3月1日、データを暗号化したまま統計解析を行うための秘密計算手法を開発したと発表した。世界で初めての成果であるこの手法を用いると、例えば、プライバシー保護のためにこれまでは組織横断的な統合が困難だった個人の医療情報や遺伝情報、行動履歴、購買履歴などを、プライバシーを一切損なうことなく、組織の壁を超えて統計解析することが期待できるという。
開発したのは完全準同型暗号という暗号系を用いる手法。完全準同型暗号は、入力情報を暗号化したまま加算や乗算を可能にする、データ解析のセキュリティ・プライバシー保護のための理想的な性質を持つ暗号系の総称。2009年に初めて実現可能な方式が提案されたが、実用的な計算時間と計算精度を保証しながら様々な統計解析を実行する手法は実現されていなかった。
研究グループは今回、代表的な統計解析が必要とする計算は、実数行列の加算と乗算、それと実数の比較演算の組み合わせに帰着できることに着目し、完全準同型暗号を用いた効率の良い行列演算と大小比較演算のためのアルゴリズム、それと、統計解析に必要な高精度の数値演算を暗号文上で実現するための演算方法を開発した。
これらを組み合わせることで、数値属性、順序属性、離散属性を含む数万レコードの暗号化データを対象として、標準的な記述統計、予測統計、統計的検定などの評価を数秒から10分程度で実現することに成功した。
完全準同型暗号を用いた秘密計算は、積み重ねられてきたアルゴリズムの工夫と高度な実装技術による高速化が図られている秘匿回路評価による計算に比べ、低速で実用性に欠けると考えられてきたが、今回の成果は、この常識を覆す画期的なものだという。
研究グループは、開発した秘密計算手法の開発フレームワークを3月末にオープンソースとして公開することを予定している。