NTT DATA

DATA INSIGHT

NTT DATAの「知見」と「先見」を社会へ届けるメディア

キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
2020.10.27INSIGHT

競え!未来を予測する力
~分析モデル構築コンテスト~

NTTデータでは、衛星画像やコロナ患者数などのデータを元に、未来の石油価格を予想するAIモデルを構築し、精度を競うコンテストを開催しました。優勝者の分析モデルでは、実際の石油価格の1ヵ月推移に対して9割を超える予測精度を出すなど、高レベルな争いとなりました。

グローバル企業としてビジネス環境の変化に対応できる技術力が求められる中、社員の技術力向上は競争力に直結する重要な課題です。NTTデータでは、技術者同士のコネクションを醸成し互いに刺激を受けながら技術力を磨く場を創るため、「Global AI Challenge」を開催しました。

Global AI Challenge 概要

Global AI Challengeは、データサイエンティスト向けのデファクトスタンダードなプラットフォームであるKaggle上でAIスキルを競うコンテストです。テーマはCOVID-19による経済的影響の予測。参加者は、衛星画像やコロナ患者数などのデータを元に、未来の石油価格を予想するAIモデルを構築し、最も高い予測精度を出した人が優勝する仕組みです。COVID-19の影響でリアルなイベント開催が難しい状況の中、グローバル横断の技術者交流機会を創出すべく、オンラインで全ての工程が完結する新しいコンテスト形式にて新設したイベントです。各国から参加した社員が、個人あるいはチームで意見交換しながら課題に挑戦しました。インプットに使用した衛星画像データは産学連携の一環として大学から提供いただいており、本コンテストで優秀な予測精度を出したAIモデルは、学術研究へのフィードバックあるいはオープンソースとして公開するなど、社会貢献に役立てる予定です。

図1:AI Challenge開催ページ

図1:AI Challenge開催ページ

図2:参加者が自身のノウハウなどの情報を投稿する様子

図2:参加者が自身のノウハウなどの情報を投稿する様子

受賞者インタビュー(1)

私のAIモデルでは、LSTM(Long-short term model)というニューラルネットワークを用いました。時系列予測に複数の手法がある中でLSTMを用いた理由は、学習データ量が多いことと、長期的な周期をとらえやすいと考えたからです。
モデルの予測対象は、今回のコンペの評価対象である75日移動平均でなく原油価格そのものとし、予測結果から75日平均を算出する方式を取りました。
また、1日単位ではなく週単位で平均をとったものを学習データとして用いることで、暴落等の異常値の影響を少なくするように工夫しました。

受賞者インタビュー(2)

石油価格に影響を与える可能性のある複数の外部ソースがあるため、予測対象が非常にデリケートでした。すべてのソースをサポートデータとして取り入れることはほぼ不可能で、さらに時系列を扱うため、他の機械学習タスクと比較して難しいプロセスでした。
その中で、ディスカッションやノートで参加者相互に行われた課題に対する意見やお試し結果の提示などが大変役に立ちました。
世界中の人々と出会い、考えやアイデアを共有する良い機会であり、貴重な経験になりました。

図3:優勝者が作成したAIモデルによる予測結果と、実際の石油価格の比較

図3:優勝者が作成したAIモデルによる予測結果と、実際の石油価格の比較

主催者インタビュー

吉田 英嗣

技術開発本部 AI技術センタ センタ長 吉田 英嗣

あらゆるビジネスへのAI適用が加速する中、データサイエンティストの需要が高まり、世界的な人財不足が叫ばれています。NTTデータグループにおいてもAI活用によるDXプロジェクトは着実に増加しており、グループ内でのデータサイエンティスト育成が急務となっています。また、社員が持つ技術力をきちんと評価したい、高いスキルを持つ人財を発掘しスポットライトを当てられる場を作りたい、と以前から思っていたこともあり、今回、競争を通じて技術スキルを磨き合える場を用意しました。今回はデータサイエンティスト向けのデファクトスタンダードなプラットフォームであるKaggleを採用しました。Kaggleは参加者同士が自分の作成したモデルに関するノウハウを共有し、学びあえる環境になっています。実際に今回のコンテストにおいて、多くの社員がKaggle上でコードやノウハウをシェアし、それをベースに参加者同士がディスカッションを行いながらラーニングが進む様子が見られました。優れた情報シェアについてはNotebook賞を設け、表彰の対象としました。このようなコンテストは1度で終わりにせず、今後も継続して大きくしていきたいと考えています。なお、本活動はAI CoE(※)の一環として実施しています。AI CoEはNTTデータグループにおけるAI技術資産を集約・蓄積し、相互に活用して、グローバル横断でのデジタルビジネス拡大を支援するためのイニチアチブで、2019年から開始しています。データサイエンティストを含むAI技術人財の育成800名が1つの活動目標になっており、本コンテストはその育成に大きく貢献するものとなります。

(※)AI技術のグローバル集約拠点、AI CoEを新たに設立

https://www.nttdata.com/jp/ja/news/release/2019/052100/

最後に

COVID-19による働き方の変化を受け、技術者育成の方法にも新たな変革が起きつつあります。グローバルで社員の技術力を高め、技術者の価値・ポジションを向上していくにはどうしたら良いのか?今回のGlobal AI Challengeでは、リモートワークを前提としたコンテスト環境で、人間だけでなくコンピュータによる判定も取り入れることで、高度な技術力ポテンシャルの適正な比較・審査を実現しました。結果的に200名を超えるAI技術者の育成とコネクション作りを達成でき、悩みながらもひとつの着地を得ました。この新たな一歩を有効に活かし、より高度なサービス提供のための技術力向上に、NTTデータは今後もグローバル一体で取り組みます。

参考資料:Global AI Challenge 2020 開催概要

お問い合わせ