東北大学大学院の牛雪澄大学院生と伊藤彰則教授らの研究チームは、チケット予約などの人から頼まれたタスクを遂行するためのシステムをより賢くする対話型人工知能(AI)の新しい手法を開発。AI自体がシステムの学習時に報酬を受け取り、新しい状況を探求するための「好奇心」を持つことで効率的な対話が可能になる。

 ChatGPTなどに代表される、自然言語を使う対話型AI技術は、ここ数年で劇的に発展し、チャットボットをはじめとした様々なシステムに活用されるなど、日常のタスクの自動化や効率化が進んでいる。しかし、現状の対話型AIは、タスク達成に不要な質問をしてしまうなど、必ずしもタスク達成の効率が十分ではなかった。

 対話システムが適切に行動するためのシステム開発手法に、将棋や囲碁のAIにも使われている強化学習がある。今回の研究では、強化学習に「好奇心駆動型の探索方法」を導入。これは、システムが新しい応答を試した際に「好奇心報酬」(フィードバック)を与えることで、システムが積極的に新しい対応方法を探索できる仕組みのこと。

 さらに、複数のエージェント(ロボットなどの行動主体)候補を用意し、その中から最もバランスの取れた行動をするエージェントを選び出す仕組みを採用した。また、訓練の後半でパフォーマンスが低下した場合には、エージェントを交換する仕組みも導入。これにより、対話によるタスク達成の成功率を向上させ、また達成までの対話回数を減らすことに成功した。

 今回の研究成果により、タスクを達成するタイプのチャットボット(受付、案内、予約など)の性能が向上し、適切な応答を返しながら短い対話で作業を終了できるようになるという。

論文情報:【IEEE Access】A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning

東北大学

イノベーションの源泉となる優れた研究成果を創出し、次世代を担う有為な人材を育成

東北大学は、開学以来の「研究第一主義」の伝統、「門戸開放」の理念及び「実学尊重」の精神を基に、豊かな教養と人間性を持ち、人間・社会や自然の事象に対して「科学する心」を持って知的探究を行うような行動力のある人材、国際的視野に立ち多様な分野で専門性を発揮して指導的[…]

大学ジャーナルオンライン編集部

大学ジャーナルオンライン編集部です。
大学や教育に対する知見・関心の高い編集スタッフにより記事執筆しています。