« 内藤頼博の理想と挫折(46) | トップページ | 内藤頼博の理想と挫折(47) »

2013年11月20日 (水)

利用できるパーソナルデータと、できないパーソナルデータの境目

必要があって、総務省「パーソナルデータの利用・流通に関する研究会報告書」(平成256月)を読んでいるのだが、腑に落ちない点がある。

ライフログビッグデータという言葉が示すように、個人がビジネスや生活の過程で残す足跡をデータとして集積したとき、莫大な経済的価値を生むと期待されている。他方、これらのデータはプライバシーと直結しうるから、「パーソナルデータの利活用促進」と「プライバシー保護」との調整という、やっかいな問題が生じる。そこでこの報告書は、保護されるべきパーソナルデータとは何か、という問題について、次のように述べている(下線は筆者)。

******************************

保護されるパーソナルデータの範囲については、現行個人情報保護法と同様、個人識別性を有するものとすることが、基本的には妥当である。

ただし、個人識別性は実質的に判断される必要がある。実質的個人識別性を有するパーソナルデータ以外のパーソナルデータは、保護されるパーソナルデータにあたらず、自由に利活用できる。

具体的には、PCやスマホの端末ID、購買・貸出履歴、視聴履歴、位置情報等は実質的個人識別性がある。IPアドレスやクッキーは、グレー。国の統計情報など、再識別化不可能なデータは、保護されるパーソナルデータにあたらない。連結による再識別化の可能性がある匿名化されたパーソナルデータについても、適切なセーフガードを設定すれば、実質的個人識別性はないから、保護されるパーソナルデータにあたらない。

******************************

理解できた?理解し易いようにまとめたつもりだが、本文はもっとややこしい。平たくいうと、パーソナルデータには、保護されるべきものと、されなくてよいものがある。保護されるべきものは、本人の承諾などがなければ利用できない。ここまではよい。では、保護されるべきパーソナルデータと、そうでないものは、どうやって区別されるのか?

報告書は、「実質的」に判断される必要がある、というのである。

では「実質的」とはなにか?分からない。報告書には、ここが分水嶺だとも、こういう考え方で区別すべきとも、書いていない。つまりは、総務省に聞かなければ、あるいは裁判で白黒つけなければ、分からないのである。「連結による再識別化の可能性のある匿名化されたパーソナルデータ」については、「適切なセーフガードを設定する」との条件付きで、実質的個人識別性が無くなるという。だが、「適切」とは何かについては、何も書いていない。結局のところ、「使えるデータ」と「使えないデータ」の境界は、「実質的」とか「適切」とかいうあいまいな基準で分けられており、何が実質的で何が適切かは、データを分析する側には分からないこととなっている。

これでは、データの利活用を促進するという、この報告書の目的が泣くというものであろう。データの利活用を促進するなら、利用して良いデータと、悪いデータとを区別する基準は、一般社会人の常識に照らして、容易に判断できるものである必要がある。

夙に指摘されているとおり、ビッグデータの真価は、「トライアンドエラー」を重ねて経験値を集積することにある。様々な種類のデータを、とっかえひっかえ組み合わせては試し、組み合わせては試すところに、存在意義がある。その際、利用して良いのか悪いのか、判断のつかないデータがあれば、大半の日本人は、利用しないだろう。安全か危険か判断がつかないとき、安全側を選ぶのが、日本人の特質だからだ。その結果、利用できるデータの範囲は、とても狭くなる。実際、報告書も、自由に利活用できるパーソナルデータとして、「一般に公開されている国の統計情報」を挙げるのみだ。しかし、国の統計情報程度しかないなら、わが国ではビッグデータの利用はできません、と言っているのと同じことではないのだろうか。

|

« 内藤頼博の理想と挫折(46) | トップページ | 内藤頼博の理想と挫折(47) »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/192469/58608236

この記事へのトラックバック一覧です: 利用できるパーソナルデータと、できないパーソナルデータの境目:

« 内藤頼博の理想と挫折(46) | トップページ | 内藤頼博の理想と挫折(47) »