Hadoop対応版の「DataRobot」を日本国内で提供開始 ~増加する企業のビッグデータを迅速に分析可能に~

ニュースリリース/NTTデータ

2018年4月19日

株式会社NTTデータ
DataRobot, Inc.
Cloudera株式会社

株式会社NTTデータ(以下、NTTデータ)、DataRobot Inc.(以下、DataRobot)、Cloudera株式会社(以下、Cloudera)は、4月19日より、エンタープライズ向け機械学習自動化プラットフォームである「DataRobot」のHadoop注1対応版の提供を開始します。

企業の業務改革や価値創造に対するAI活用の期待によりビッグデータ活用が求められる中、データを蓄積するプラットフォームとしてビジネス規模やデータ量の拡大に合わせて柔軟に拡張できるHadoop基盤を利用する企業が増えています。一方、データ分析を行う際には、データ抽出や集計する個別のDataMart注2を構築したうえでデータを取り込む必要があり、DataMartに取り込まれないHadoop基盤上のデータを活用しきれないという課題がありました。

Hadoop対応版の「DataRobot」は、Hadoop基盤から直接データを取り込み、Hadoop基盤の処理能力を使って分析(各種の予測モデル構築、予測処理など)を実施できます。これにより、これまで企業の中で眠っていた膨大なデータに対しても、機械学習の自動化によるデータ活用が飛躍的に進歩することが見込まれます。

今回、Hadoop対応版の「DataRobot」は、Clouderaが提供するデータプラットフォーム上での動作検証を完了しています。

背景

昨今、企業の業務改革や価値創造に対するAI活用の期待が高まりつつあり、膨大に蓄積されていくビッグデータを活用していくことが求められています。これまでは自社で得たデータのみを対象に分析を行っている企業が大半でしたが、これからはネット上の顧客行動履歴やSNSなどの社外データ、IoT技術で新しく獲得できるようになったデータなどを分析で活用し、高度な分析を行うことが必要になってきています。

【図】

概要

Hadoop対応版の「DataRobot」は、従来の「DataRobot」の特長をそのまま兼ね備えながら、データを蓄積しているHadoop基盤から直接データを取り込んで分析できます。利用企業は分析用のDataMartを個別に構築する必要なく、Hadoop基盤上で必要なデータの準備をして分析を行います。また、Hadoop基盤上の処理能力を活用し、高速な予測モデル構築や予測処理が可能になります。

【図】

Hadoop対応版の「DataRobot」は、日本国外では提供されていますが、2018年3月末時点で日本国内では提供されていません。今回、DataRobotの販売代理店パートナーであるNTTデータにより、Clouderaプラットフォーム上でのHadoop対応版の「DataRobot」の動作検証が完了し、提供できる体制が整備されたため、4月19日より正式にサービス提供を開始することになりました。

導入メリット

デジタルマーケティングの領域においては、従来の大まかな市場予測を行うマスマーケティングではなく、多様なチャネルから集まる膨大な情報を基に、個人ごとの特性や好みに合わせて個別最適な提案を行うOne to Oneマーケティングでの活用が期待されています。

また、製造業の領域において、何千種類もある部品やプロセスごとに需要予測や不良品検知を行うことができるようになり、納品までのリードタイム短縮やこれまで以上の業務効率化が可能となります。

今回拡張される機能と利用上のメリットは下記の通りです。

1.外部データ/新規データを活用した新テーマ検討

Hadoop基盤上に新しく蓄積した外部データや新規データを活用するためには、データから個別のDataMartを構築し分析を行う必要がありました。Hadoop対応版の「DataRobot」は直接Hadoop基盤から分析データを取り込んで利用できるため、従来の抽出や集計、ダウンサイジングなどのDataMart構築にかかる処理を簡素化し、これまで使えていなかったデータを使って、「新規ビジネスの創出」や「既存業務の改善」に向けた新テーマ検討を加速させます。

2.大量データでの試行錯誤の効率化

予測モデルの精度を上げるためには新しいデータを入れて試行錯誤したり、学習データ量を増やしたりといった対応をとる必要があります。従来の機械学習アルゴリズムは単一マシンでの動作を前提としていたものが多く、単一マシンの処理能力が制約となっていたため、現実的なデータ量に落として予測モデル作成を行っていました。

分散型アルゴリズム(Spark MLlib, H2O等)はHadoopの規模が大きくなればなるほど分散処理によって短い時間で予測モデル作成を行うため、大量データに対しても現実的な時間で予測モデル作成が可能になります。これにより、精度の良い予測モデルを作るための試行錯誤が効率的にできるようになるというメリットがあります。

3.個別データ予測により、より細やかな判断が可能

大量のデータに対して予測を実施したい場合にも、Hadoop Scoringという分散型バッチ予測の機能により、Hadoop基盤上の分散処理の仕組みを有効活用して従来の「DataRobot」の予測エンジンよりも高い処理能力で大量の予測を行います。これにより、個々のデータ特性に合わせて予測を行い、より細やかな判断ができます。例えば、マーケティングにおいて何万件もいる顧客ひとりひとりに対して購買予測を実施することで、個別の傾向に合わせたアクションが可能になります。

【図】

各社の役割

NTTデータ

  • Hadoop対応版の「DataRobot」に関するインテグレーションサービス提供

DataRobot

  • 機械学習自動化プラットフォーム「DataRobot」のHadoop対応版提供

Cloudera

  • 機械学習と分析のためのデータプラットフォーム「Cloudera Enterprise」、ならびにプロフェッショナルサービスの提供

参考

DataRobotについて

「DataRobot」は、世界トップレベルのデータサイエンティストの知識、経験、ベストプラクティスを組み込んだ機械学習自動化プラットフォームです。ユーザーは非常に正確な機械学習モデルを短期間で構築し、即座にシステムへ展開できます。Hadoop対応版の「DataRobot」に対応するHadoopディストリビューションとしては、ClouderaとHortonworksが選択可能です。

DataRobot, Inc.について

社名:DataRobot, Inc.
所在地:One International Place, 5th floor, Boston, MA 02110
DataRobotはあらゆるスキルレベルのデータサイエンティストが、正確な予測モデルを構築し、配備するための機械学習自動化プラットフォームを提供しています。

Cloudera Enterpriseについて

Clouderaが提供するエンタープライズ向けの機械学習と分析のためのデータプラットフォームです。今回提供を開始するHadoop対応版の「DataRobot」は、「Cloudera Enterprise」と組み合わせることにより、追加のモジュールを必要とせずClouderaの管理ツールから一元的にインストール、ランタイムライブラリの配布、セキュリティ設定、データリネージ(データ追跡)などが容易に行え、安全かつ安定したエンタープライズ向けの運用管理環境が提供できます。

Cloudera株式会社について

社名:Cloudera株式会社
所在地:東京都中央区
Clouderaは、データの力によって、今日不可能なことを明日可能にできると考え、明確でかつ行動につながるインサイトを複雑なデータの中から得ようとする企業を支援し、クラウドに最適化された機械学習および高度な分析のための最先端のプラットフォームを提供します。Clouderaは最も困難なビジネス上の課題を解決する際のパートナーとして世界中の大企業から信頼を得ています。

NTTデータの関連サイト

注釈

  • 注1Hadoopとは、大規模データの蓄積・分析を分散処理技術によって実現するオープンソースのミドルウェアです。
  • 注2DataMartとは、利用目的に合わせて個別に構築するデータベースを指します。目的に合わせているためデータ量も必要最小限で扱いやすい一方、運用にコストがかかる傾向があります。一般的にデータ量を圧縮するために、利用頻度が高い直近のデータのみを持ったり、明細データを集計して持つケースが多いです。
  • DataRobotは、日本国内におけるDataRobot, Inc.の登録商標です。
  • ClouderaおよびClouderaのロゴはCloudera Inc.の商標として米国その他の国に適用されています。
  • その他の商品名、会社名、団体名は、各社の商標または登録商標です。

本件に関するお問い合わせ先

報道関係のお問い合わせ先

株式会社NTTデータ
広報部
西澤
TEL:03-5546-8051

DataRobot Inc.
DataRobot PR事務局(MSL内)
浅野、大森
TEL:03-5719-8901
E-mail:datarobot_pr@msljapan.com

Cloudera株式会社
広報事務局(ホフマンジャパン株式会社内)
上田、松田、田中
TEL:03-5159-5750
E-mail:ClouderaJP@hoffman.com

製品に関するお問い合わせ先

株式会社NTTデータ
ビジネスソリューション事業本部
AI&IoT事業部
ソリューション統括部
小酒井、有光
TEL:050-5546-7939
E-mail:datarobot_inquiry@am.nttdata.co.jp

DataRobot Inc.
瀧澤
E-mail:info-jp@datarobot.com