1.はじめに
近年、プライバシーや機密情報を保護するための「プライバシー強化技術」(Privacy-Enhancing computation:PEC)が注目を集めています。その中でも秘密計算を用いた、企業や業界を横断したデータの収集や精度の高い分析が期待されています。実際に、ヘルスケア分野や金融分野などあらゆる業界で活用が検討されています。
本稿では、秘密計算の活用における課題や規制改革に向けた動きを紹介し、今後の動向を展望します。
https://www.ntt.com/about-us/press-releases/news/article/2022/1129.html
https://www.nttdata.com/global/ja/news/services_info/2022/011100/
2.秘密計算とは
秘密計算とは、個々のデータを暗号化したまま計算可能な技術です。データ提供者は、自身のデータを他者から秘匿したまま共有し、計算結果を得ることができます。この秘密計算には、主に「秘密分散を利用する手法」と「準同型暗号を利用する手法」の二つがあります。
(1)秘密分散を利用した秘密計算
秘密分散は、乱数を用いて断片化することで情報の秘匿を行い、計算をする手法です。
まずシェアと呼ばれる断片に情報を分割します。シェアは元のデータから計算されて、乱数のように見えるデータであり、シェア単体から元のデータを復元できません(図1)。
図1:秘密分散の概要
ここでは、マルチパーティ計算(Multi-party Computation:MPC)によって、このシェアを複数のサーバに分散して送信し、サーバ間で補助通信を行いながら計算を行います。これによって、複数のデータ提供者はそれぞれのデータを秘匿したまま計算結果を得ることができます。(図2)。
図2:秘密分散とMPCを利用した秘密計算の概要
(2)準同型暗号を利用した秘密計算
準同型暗号は、情報を暗号化したまま計算をする手法です。
まずデータをデータ活用者の公開鍵で暗号化します。これをサーバに送信し、暗号化したまま分析を行います。計算結果を秘密鍵で復号することで、他のデータ提供者や分析者に自分のデータを知られることなく、分析結果のみを得ることができます(図3)。
図3:準同型暗号を利用した秘密計算の概要
より技術的な詳細解説は以下の記事(※3)でご覧になれます。
3.活用に向けた課題
秘密計算は安全にデータの利活用を可能とする一方で、実際の活用時には個人情報保護法による制限が存在します。同法によって利活用可能なケースが制限されています。匿名加工情報(※4)という、個人情報保護法に制限されない技術もありますが、現時点では秘密計算によって秘匿された個人情報は、匿名加工情報とは見なされていません。以下では個人情報保護法による秘密計算の制限、および秘密計算と匿名加工情報の違いについて紹介します。
(1)秘密計算の個人情報保護法における注意点
秘密計算によって個人情報を扱う際には、個人情報に該当するかどうか、第三者提供時の本人への同意、個人情報が漏えいした際の個人情報保護委員会への報告という3つの主要なポイントがあります(図4)。
図4:個人情報保護法における注意点
個人情報の保護に関する法律についてのガイドラインでは、個人に関する情報として「暗号化等によって秘匿化されているかどうかを問わない。」とされているため、秘密計算で秘匿化された場合にも個人情報に該当し、個人情報保護法が適用されます。
また、個人情報保護法において、「あらかじめ本人の同意を得ないで、個人データを第三者に提供してはならない。」とあるため、秘密計算で秘匿化された情報も個人情報に該当し、第三者提供時には本人の同意が必要となります。
さらに、個人情報取扱事業者は、個人情報の漏えい、滅失、毀損など、個人の権利利益を害する恐れが大きいものについては個人情報保護委員会に報告義務があります。一方で、「第三者が見読可能な状態にすることが困難となるような暗号化等の技術的措置」を行った場合は、報告が免除されますが、その具体的要件や安全性基準は明確化されていません。そのため、秘密計算によって秘匿化された個人情報が漏えいした際には報告の免除とはなりません。
(2)秘密計算は匿名加工情報に該当しないのか?
一方で、匿名加工情報として加工された情報は、個人情報に該当しないため、第三者提供時の同意や漏えい時の個人情報保護委員会への報告義務はありません。以下に秘密計算と匿名加工情報の違いについて紹介します(表1)。
表1:秘密計算と匿名加工情報の違い
匿名加工情報の定義は、「個人情報を特定の個人を識別することができないように加工して得られる個人に関する情報であって、その情報を復元して特定の個人を再識別することができないようにしたもの」とされています。具体的には、特定の個人を識別できる記述の削除や個人識別符号の削除などが挙げられます。
秘密分散においては、シェアに分割して秘匿化した状態では、個人を識別することは不可能です。しかし、断片化したシェアを集めると元データが復元されてしまいます。このことから、秘密計算は匿名加工情報とみなされていないと考えられます。
4.規制改革に向けた動き
一方で、2016年頃から秘密計算の規制改革に関する議論がされています。さらに、近年はよりさまざまな団体による規制改革の活動や、普及啓発の活動が活発化しています(表2)。
表2:近年の主な規制改革や普及啓発活動
特に秘密計算技術のISO国際標準化は秘密計算技術の社会的な受容に一定の効果があったと言えます。
今後は、規制改革に向けた提言や普及啓発活動の他にも、安全性基準を満たす利用ケースの蓄積がより重要となります。これによって安全性を客観的に評価可能となり、個人情報保護委員会への報告免除となる暗号化基準や匿名加工情報への秘密計算の該当性について、説得力をもって議論を進めることができます。
https://www.meti.go.jp/shingikai/sankoshin/shomu_ryutsu/joho_keizai/008.html
~利用者が安心して秘密計算を利用できる世界の実現に向けて~
~データ利活用とプライバシー保護を両立する先進テクノロジーの普及を推進~
5.おわりに
近年、データ活用が注目されていますが、企業や業界を横断したデータの活用は十分には至っていません。秘密計算によって安全に幅広いデータを活用することで、以下のような活用が期待されます。
- 患者のゲノム情報や診療情報を安全に結合することによる創薬への活用や、患者個人に適応した治療
- 投票者が誰に投票したのか秘匿したまま集計可能な電子投票システム
- 複数の金融機関の電子取引情報を結合することによる不正取引検知の精度上昇
- 電車などの乗降データや駅近辺での決済データを結合することによる販売の促進
- 秘密計算を使ったAIによる製造業や小売業におけるサプライチェーンの効率化
上記で挙げた例はほんの一部に過ぎません。
今後の秘密計算の積極的な活用に向けて、規制改革の動向を把握しつつ、どのように活用できるかを検討していくことが求められます。
NTT DATAでは引き続き最新動向をキャッチアップし、ノウハウを蓄積・公開していきます。
あわせて読みたい: