NTT DATA

DATA INSIGHT

NTT DATAの「知見」と「先見」を社会へ届けるメディア

キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トピックで探す
2023.5.25業界トレンド/展望

NTTデータとMIT Media LabのコラボレーションによるAI研究の最先端

2022年8月、NTTデータは革新的なパートナーとともにものづくりに取り組み、先進技術によって新たな価値を創出することを目的とするイノベーションセンタを6カ国で立ち上げた。連携するパートナーは先進技術を保有する企業や大学、研究機関などで、その1つが、約5年前から共同研究を進めているアメリカのマサチューセッツ工科大学メディアラボ(以下、MIT Media Lab)である。中でも大きな研究テーマとなっている人工知能(AI)について、MIT Media LabのPattie Maes氏に話を聞いた。
目次

人の作業を代替するのではなく、人のパフォーマンスを拡張するAIへ

NTTデータは中期経営計画(2022年度~2025年度)において、「先進技術活用力とシステム開発技術力の強化」を重要な戦略の1つと位置づけている。この戦略を現場で担うのがイノベーションセンタであり、企業や大学などのパートナーと共に先進技術に関する研究を行っている。

重要な連携パートナーの1つ、MIT Media Labとの研究について、NTTデータ 技術開発本部 イノベーションセンタ センタ長の古川洋は次のように説明する。

技術開発本部 イノベーションセンタ センタ長 古川 洋

技術開発本部 イノベーションセンタ センタ長
古川 洋

「MIT Media Labとは、企業との共創やスタートアップとのエコシステムづくり、新たな技術のキャッチアップ、認知症の予防、シミュレーション技術を使った都市計画といった幅広いトピックに関する研究プロジェクトを進めています」(古川)

AIの研究に30年間携わり、MIT Media Labの教授として活動するMaes氏の研究チームは現在、「AIは人のパフォーマンスを拡張し最適化できるのか」をテーマに研究に取り組んでいる。研究を通じ、AIは人のパフォーマンスを向上させ、ウェルビーイングを最適化できるとMaes氏は語る。

「過去60年間、AI研究は人にとって困難なことをコンピュータが代替したり、より優れた方法で実行したりすることがゴールとされていました。そこで注目されているのは、あくまでタスクの遂行であり、複雑な問題の解決ではありませんでした。しかし、人の仕事は複雑に要素が絡み合うものであり、狭義のタスク遂行だけでは解決することが難しいものです。人が最適なパフォーマンスを発揮することを支援するためには、AIが単純なタスクの遂行を超えて、現実世界でのインテリジェントな意思決定者支援をすることが必要だと考えています」(Maes氏)

MIT Media Lab教授 Pattie Maes 氏

MIT Media Lab教授
Pattie Maes 氏

このようなAIに関する考え方がトレンドとなっている一方、「AIは必ずしも人や組織等を理解している人ではなく、エンジニアを中心に開発されているため、AIを導入する際にもあまり深く検討されることはなく、人とAIのパフォーマンスを最適化する方法についてもっと検討する余地がある」とMaes氏は言う。

「エンジニアリングの観点で開発されたAIは、既存のワークフローや通常の作業環境に合わず、対象ユーザーからの信頼を得ることができません。またエンジニアだけが設計に関わると、今後AIがどのようにわれわれの生活に影響を及ぼすのかといった懸念が残ります。重要なのは、AI自体の機能を最適化するだけでなく、AIを活用して人の能力を拡張し、よりよい判断や効果的な作業を支援できるようにすることです」(Maes氏)

これからのAI設計における最適なアプローチ

NTTデータでは、2019年にAIガイドラインを立ち上げた後、大学教授など外部の専門家をメンバーとするAIの諮問委員会も設置するなど、AIシステムの品質の担保を図っている。

「これからAIシステムを設計する際、社会的な問題にどう対応していくべきなのか」という古川の問いに対し、「AIシステムの公営性やバイアスの有無を確認するだけでなく、人とAIのシステムの組み合わせによってよりよい判断ができるかどうかをテストするアプローチが重要になる」とMaes氏は答える。

「人々は何か文章を読んだり聞いたりした時に、レポートの内容をあまり考えずに受け取り、真実であるかどうかを合理的に判断しない場合があります。例えば、マイクとスピーカーが内蔵されたメガネ型の概念実証システム『Wearable Reasoner』を使った研究では、AIがもっともらしい説明を添えながら何かしらアドバイスすると、ユーザーは自分たちの意見を変える傾向が見られました」(Maes氏)

図1:Wearable Reasonerを使った実証実験

図1:Wearable Reasonerを使った実証実験

さらにMaes氏は、人に対して虚偽のアドバイスをする”悪い”AIを使った実験も行っている。

「あたかも信頼できると思えるようなAIからの虚偽のアドバイスに対して、ユーザーはその内容を信じ込み、よくない意思決定をしてしまいました。AIから説得力のある説明があると、人はよく考えずにAIを信じてしまうということがわかりました。このような問題に対し、私たちは最近、『ソクラテスの問い』の手法を使ったシステムを構築しました。AIからのアドバイスを提供する前に、ユーザーにその問いについて強制的に考えさせることで、そのユーザーはベストな判断を導くことができました」(Maes氏)

あらゆるアウトプットを自動生成するジェネレーティブAIの可能性

NTTデータでは、市場を分析する技術レーダーマップを作成し、データインテリジェンスの世界でどの領域に専門性を構築すべきかの指針として活用している。そして、その結果として導かれた「ジェネレーティブAI(Generative AI)」と「Foundation Model」という2つの領域において、ソースコードの生成や保険業界向けの保険請求処理システムの開発に取り組んでいる。これらの領域の可能性について、Maes氏は次のように話す。

「システムがウェブ上のテキスト情報などを学習し新たな画像や文章をつくり上げる生成に関しては、アメリカでも非常に関心が高まっていて、さまざまなデータが活用されています。下の画像は、雑誌の表紙を担当するデザイナーが入力した『月を歩いている宇宙飛行士、下からのアングル、スタジオの照明、色はこれ』といった条件をもとに、AIがオンライン上の利用可能な画像からオリジナルの新たな画像を生成したものです」(Maes氏)

図2:ジェネレーティブAIによって自動生成された雑誌の表示画像(左)

図2:ジェネレーティブAIによって自動生成された雑誌の表示画像(左)

Maes氏は「ジェネレーティブAIは画像だけでなく、テキストも生成できる」と続ける。

「ジェネレーティブAIによって自然言語で文法的な誤りのない優れたテキストを生成することができます。実際、イギリスの新聞ガーディアンには、ジェネレーティブAIによって書かれた記事が掲載されたことがあります。またある実験では、人が書いた段落と、ジェネレーティブ AIが書いた段落が混在する文章を読ませたところ、読者はどの部分が人によって書かれたものかを判断することができなかったという結果が出ました。それほど、AIによる文章が素晴らしいものになっているのです」(Maes氏)

いまやジェネレーティブAIはさまざまな方法で活用されている。

「例えば、『チャールズ川の夕暮れ時の風景、モネ風』と指示を出すと、ものの15秒でその通りの絵が完成します。建築分野ではデザインの参考にするためにAIが使われています。私は試しにAIチャットボットの『ChatGPT』に、『AIは人の仕事を奪ってしまうのか』と問いかけたことがあります。すると、『AIによって人の作業を置き換えるのではなく、AIを活用することで人の力を拡張すべきである』という、思慮深い答えが返ってきました」(Maes氏)

図3:ジェネレーティブAIが15秒で生成したモネ風の絵画

図3:ジェネレーティブAIが15秒で生成したモネ風の絵画

図4:ジェネレーティブAIが創り出した独創的なビルのモデル

図4:ジェネレーティブAIが創り出した独創的なビルのモデル

ジェネレーティブAIの活用領域について、Maes氏は次のように話す。

「ジェネレーティブAIを使えば、ティーカップや花瓶といった3Dのオブジェクトも生成できます。さらに、Metaはテキスト情報を基にジェネレーティブAIで映画を制作しました。『犬がケープをまとって、空を飛んでいる映画』といった言葉を入力しただけで、素晴らしい映画作品が完成しました。科学の分野でも活用は広がっており、新しいたんぱく質の構造解明のためにジェネレーティブAIが使われています。また、入力された条件からプログラミングコードを作成するAIの開発には、5社以上のスタートアップ企業が取り組んでいるところです」(Maes氏)

図5:テキスト情報から生成された3Dオブジェクト

図5:テキスト情報から生成された3Dオブジェクト

図6:ジェネレーティブAIを使って制作された映画作品

図6:ジェネレーティブAIを使って制作された映画作品

このように、急速に活用の幅が広がり続けるジェネレーティブAIだが、課題もある。
まず、AI研究者自身もこれらのシステムが何をしているのかを理解していないことが懸念されている。また、出力の質が低かったり、独自のバイアスがかかっていたりする場合がある。過去には、ジェネレーティブAIを使って医師の画像を生成すると必ず白人男性になってしまうため、システムの変更が必要になったケースもあったという。

ほかにも、人の画像を使ってコードを書き、映像の中でその人が実際には言っていない内容の発言をさせることができる「Deep Fake」や、フェイクニュースの悪用、AIの利用拡大に伴う電力消費といった課題にも取り組んでいかなくてはいけないだろう。

社会への幅広い貢献が期待されるバーチャルキャラクター

NTTデータとMIT Media Labのコラボレーションの中でも、「AIによる社会貢献」は大きなテーマになっていると古川は言う。その具体的な内容について、Maes氏は次のように説明する。

「社会の利益という観点からご紹介したいのは、AIによって生成するバーチャルキャラクターです。ジェネレーティブAIは画像やテキスト、動画の生成が中心ですが、音声も組み合わせることでバーチャルキャラクターをつくることができます。私たちのシステムでは、ライブ動画や音声の記録、画像やテキストのデータなど、どのようなインプットからでもオリジナルの動画の中で話している人物の顔を入れ替えたり、違うことを言わせたりすることができます」(Maes氏)

図7:あらゆるデータのインプットから自動生成されるバーチャルキャラクター

図7:あらゆるデータのインプットから自動生成されるバーチャルキャラクター

Maes氏の研究チームはさまざまなポジティブなユースケースを検討し、バーチャルキャラクターの効果的な活用方法を模索している。例えば教育分野では、学習したい内容の講義動画の講師をハリー・ポッターやアインシュタインなどのバーチャルキャラターにすることで、生徒の学習意欲を高める効果が期待できるという。また歴史的な人物のバーチャルキャラクターに自伝や日記などのデータを読み込ませれば、生徒からの質問に歴史的キャラクターが回答するというインタラクティブなコミュニケーションも可能になる。

図8:バーチャルキャラクターのレオナルド・ダ・ヴィンチとの会話例

図8:バーチャルキャラクターのレオナルド・ダ・ヴィンチとの会話例

社会貢献という観点でみると、バーチャルキャラクターは教育のみならず、カスタマーサービスなど多様な使い方ができるという。

「バーチャルキャラクターは独りで寂しい時に話し相手になってくれたり、美術館でガイド役として活躍してくれたりするでしょう。パーソナルアシスタントのように、側でアドバイスをしてくれたり、高齢者の記憶を呼び覚ますサポート役として活用したりすることも想定しています」(Maes氏)

AI技術は近年急速に進化しているが、その技術を正しく使いこなせれば人の強力な”サポーター”となることは間違いない。そのために、MIT Media LabとNTTデータは今後も連携して、社会貢献につながる最先端の研究を進めていく。

本記事は、2023年1月24日、25日に開催されたNTT DATA Innovation Conference 2023での講演をもとに構成しています。

お問い合わせ