東北大学大学院の牛雪澄大学院生と伊藤彰則教授らの研究チームは、チケット予約などの人から頼まれたタスクを遂行するためのシステムをより賢くする対話型人工知能(AI)の新しい手法を開発。AI自体がシステムの学習時に報酬を受け取り、新しい状況を探求するための「好奇心」を持つことで効率的な対話が可能になる。
ChatGPTなどに代表される、自然言語を使う対話型AI技術は、ここ数年で劇的に発展し、チャットボットをはじめとした様々なシステムに活用されるなど、日常のタスクの自動化や効率化が進んでいる。しかし、現状の対話型AIは、タスク達成に不要な質問をしてしまうなど、必ずしもタスク達成の効率が十分ではなかった。
対話システムが適切に行動するためのシステム開発手法に、将棋や囲碁のAIにも使われている強化学習がある。今回の研究では、強化学習に「好奇心駆動型の探索方法」を導入。これは、システムが新しい応答を試した際に「好奇心報酬」(フィードバック)を与えることで、システムが積極的に新しい対応方法を探索できる仕組みのこと。
さらに、複数のエージェント(ロボットなどの行動主体)候補を用意し、その中から最もバランスの取れた行動をするエージェントを選び出す仕組みを採用した。また、訓練の後半でパフォーマンスが低下した場合には、エージェントを交換する仕組みも導入。これにより、対話によるタスク達成の成功率を向上させ、また達成までの対話回数を減らすことに成功した。
今回の研究成果により、タスクを達成するタイプのチャットボット(受付、案内、予約など)の性能が向上し、適切な応答を返しながら短い対話で作業を終了できるようになるという。