1.データ民主化(Data Democratization)の課題
民主化が、「一部の特権階級が支配する構図を是正し、民の手元に“あるべき権利“を復権する」ように、データ民主化は、「一部のヒトがデータを扱う仕組み・運用を見直し、ユーザーが直接データを取り扱えるようにする」取組として推進されています。しかし、民主化が国・社会によって多様な形態を見せるように、データ民主化も一様の処方箋は存在せず、状況によってはむしろ混乱を助長する側面を見せています。
図1:民主化は一部の特権階級が支配する構図を是正し、民の手元に“あるべき権利“を復権する
根源的な問題は、利用可能なデータが、第三者が第三者の意図を以て過去に生成したものであり、今この時のユーザーのコンテキストにマッチする回答を導くために作られたものではない事です。例えば娘に「プリキュアにどうやってなれば良いか」聞かれた時、手元に「プリキュアの年齢」のようなデータしか無ければ、「平均14歳になったらプリキュアになれるよ」とでも答えるしかありません。「プリキュアみたいにキラキラするためには?」「プリキュアみたいに強くなるためには?」様々な視点から解を求めるには、データ民主化の先に開かれた知の体系を整備する必要があります。
図2:利用可能なデータそれ自体に、民主化前の構造が温存されている
2.ナレッジグラフによるデータ脱構築(Data Déconstruction)
テーブルやドキュメント型でデータを保持する従来型のデータ管理は、「正答が既存データ内に在る事」を前提とするClosed world assumptionで成り立っており、そのフォーマットには「決まった価値を正しく回答する」作成者の意図が色濃く反映されています。一方、「今まで誰も気づいていない価値」をデータから創出するためには、ノイズである「過去の経緯や価値観が埋め込まれたフォーマット」は取り払い、現時点の視点で探索対象データを再構成する必要があります。データのナレッジグラフ化(※1)、(※2)は、Open world assumptionでのデータ脱構築を実現し、フォーマットに捉われないデータ探索を可能にするものです。
図3:ナレッジグラフ化は過去の経緯や価値観を取り払い、データ脱構築を実現する
プリキュアみたいにキラキラするために、「髪型」「コスメ」「コスチューム」のような視点でデータを探索しても良いですし、プリキュアみたいに強くなるために、「性格」「想い」「決め台詞」のような視点でデータを探索しても良いでしょう。正解の無いデータサイエンスは、格子の無いデータ探索があって初めて、より良い解に辿り着きます。
3.データ民主化基盤としてのナレッジグラフ管理フレームワーク
民主化が「権力を手にする民とは誰か」を問い続けるプロセスで実現されるように、データ民主化は「データを使うコンテキストは何か」問い続ける試行錯誤のプロセスで実現され、その柔軟性を担保する鍵となるテクノロジーがナレッジグラフです。企業でのナレッジグラフ導入を支援するために、NTTデータ「ABLER」(※3)ではナレッジグラフ管理フレームワークを作成しており、企業内データや外部データを自動的に取り込んでナレッジグラフ化する事が可能です。データ活用にお悩みの方、ナレッジグラフにご興味ある方は是非ご連絡下さい。
図4:ナレッジグラフ管理フレームワークが企業内外のデータを取込み、データ活用を促進する
商標について:記載されている会社名、システム名、製品名は各社の登録商標または商標です。
©ABC-A・東映アニメーション