NTT DATA

DATA INSIGHT

NTT DATAの「知見」と「先見」を社会へ届けるメディア

キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
2022.12.22技術トレンド/展望

データ活用のススメ~民主化を阻む4つの落とし穴~

近年、DXの流れでデータ活用やAI開発を自社で内製化する企業が増えている。
このようなお客様に対しNTTデータでは様々な支援を行っているが、お客様が直面する共通の課題が存在する。
本稿ではデータ活用における課題について紹介し、どのような対策を行えばよいか解説する。
目次

1.データ活用においてよくある課題

本章ではデータ活用/データ民主化における課題について、代表的なものを4つご紹介します。
データ活用を進める中でこれらの課題が顕在化することを事前に把握し、対策を検討しておくことが肝要です。

図1:データ民主化を阻む4つの要因

図1:データ民主化を阻む4つの要因

(1)AIとデータ活用を推進する人材の不足

AI・データ活用をより効果的に行うには、蓄積したデータを必要な形に加工し、課題や改善点を導き出して、課題の解決に役立てることのできる人材が必要です。しかし、データ活用ができる専門的な知識をもった人材を見つけるのは容易ではなく、自組織で人材育成を行うにも時間と労力が必要となり、実務経験を通して知識を身に着けることも難しいのが実態です。

(2)部門や役割間での分析環境のサイロ化

データのサイロ化から脱却し、統合されたデータを活用できる状態にはなっていても、データ分析環境の機能が足りていないため、部門毎または役割毎に特定用途の分析環境を個別に構築しているケースが散見されます。この場合、作成したデータ加工処理や分析過程などのノウハウが部門間または役割間で共有されず、再利用できない状態となります。極端に言うと隣の分析者が何をやっているのか分からない状況に陥ってしまいます。

(3)データ準備におけるリードタイムの発生

データ活用業務の80%はデータ準備と言われている通り、データ分析を行うための前準備に時間を取られてしまい、本来行うべきデータ分析に十分に時間をかけることができない事態がよく発生します。データ準備にはSQLやPythonなどを使って処理する方法やETLツールを使うのが主流ですが、作業が大変であることに加え、データ準備する組織と分析する組織が分かれており、連携に時間を要するというのも一因となっています。

(4)セキュリティ・ガバナンスの煩雑さ

データ活用が盛んになるほどに懸念されるのが、データの漏洩や不適切な利用など、セキュリティとガバナンスの問題です。コンプライアンスを保証するためのリスク管理が重要となりますが、データにアクセスできる人が増えるほどアクセス制御や作業履歴の取得は煩雑となり、また、膨大なデータの変更履歴や依存関係を把握しきれないという問題が発生します。

2.どのような対策をとるべきか

前章にてデータ活用における4つの課題についてご紹介しましたが、これらの課題に対してどのような対策をとっていくのが良いのでしょうか。
各課題に対する根本原因が組織やプロジェクトによって異なるため、有効な対策は多岐に渡るかと思いますが、ここでは技術的な対策の一つである、「データプリパレーションツールの導入」についてご紹介したいと思います。

データプリパレーションツールの導入

「データプリパレーションツール」とは一般的にデータ収集/データクレンジング/データ結合といったデータ準備のタスクを補助するためのツールを指します。
「ビジネスユーザが直感的な操作ができるように設計」されており、データ活用にかかる工数を削減し、高度なスキルが無くても作業ができるようになる(=人材獲得の難易度を下げられる)ことが大きな特徴です。
また、近年ではデータ準備だけでなく、可視化・分析(BI)/機械学習(AI)といったデータ活用の部分もカバーしたオールインワン製品も登場しております。
データ活用基盤にこちらを利用することにより、インタフェースが一元化(同じWeb画面から様々な情報へのアクセス・操作ができる)され、部門間との情報連携・コミュニケーションが取りやすくなる、セキュリティ等の管理がしやすくなるなどのメリットもあります。

図2:一般的なデータプリパレーションツール機能とデータ活用プロセスとの対応

図2:一般的なデータプリパレーションツール機能とデータ活用プロセスとの対応

ただし、オールインワン製品は機能が充実している分、ライセンス費用等の初期コストがかかってしまいます。そのため、スモールスタートで開発するために従量課金型であるクラウドサービスの組み合わせを選択するお客様も多くいらっしゃいます。
しかしながら、クラウドサービスの組み合わせで実装する場合、システム開発だけでなく運用フェーズにおいても多くのITエンジニアを抱える必要があるため、自社で人材確保が難しい場合はツール導入も運用コストの観点で一考の余地があるかと思います。

データプリパレーションツールの例としてはDatabricksやDataiku等があります。そのうちの一つであるDataikuはデータサイエンス&機械学習プラットフォームのリーダー製品で、データ活用の全プロセスが一つのプラットフォームで完結しているといった特徴があります。

図3:データプリパレーションツール(Dataiku)概要

図3:データプリパレーションツール(Dataiku)概要

3.最後に

本稿ではデータ活用の内製化における課題と対策についてご紹介しました。
データ活用の実現においては高度かつ専門的なスキルを有した人材を確保する必要がありますが、世の中の動向としてデータ活用人材が不足している状況のため、誰でもデータ活用を可能とする「データ民主化」の考え方がより一層求められると思います。
技術的な対策の一つとして、データプリパレーションツールが挙げられ、これをデータ活用基盤に利用することで、データ活用に係る負荷・人材獲得の難易度の低減、情報共有・コミュニケーションの効率化、ガバナンスを効かせやすくするといったことが有効と考えます。ただし、ツールを入れれば終わりというわけでなく、組織間で円滑に協力し合えるよう、上位層による運用体制や利用ルールの整備も併せて対応が必要です。

NTTデータではデータ活用に関連するソリューションベンダとパートナーシップを結んでおり、多数の製品有識者と豊富な導入実績を有しておりますので、お気軽にご相談ください。

お問い合わせ