静岡大学は、ヤマハ発動機株式会社と連携し、十分かつ高品質な教師データの準備や作成に労力を要する農業分野等での機械学習タスクに対し、条件つき画像生成AIを用いた新たな生成データ拡張手法の研究開発に成功した。
スマート農業の実現には、農作物の画像から特定の部位をラベル付けした大量の教師データが必要となる。しかし、農作物の画像データは条件・環境により様々な様相を示し、多様なドメイン的特徴を持つ。花や果実、節、熟度、病害の程度などのラベル付けにも曖昧さが伴い、高品質かつ一貫した大量の教師データの作成が困難だった。
研究グループは、条件つき画像生成AIを用いた新たな生成データ拡張手法を開発。この手法では、無人地上車両(UGV)等で撮影される動画データから大量の画像データを抽出し、まずこの大量の画像データを用いて大域的な特徴を学習させる。次に、少量の教師画像データを用意して局所的な特徴を追学習させ、指定する条件に沿ったドメイン的特徴を持つ教師画像データを機械的に大量に自動生成できる。
これにより、ワインブドウの成育測定での少量の夜間画像から昼間画像の生成データ拡張を行い、様々な物体検出モデルとKeypoint検出モデルで有効性を検証した。その結果、物体(BBox)検出タスクで28.7%、部位(Keypoint)検出タスクで13.7%の大幅な精度向上が見込まれることを確認した。
これにより、教師画像データ準備(2,400枚)に要する労働時間を600時間から1時間程へと大幅削減が可能。また、異なる時刻や天候、圃場、成長段階などの変化にも適用でき、作物の成長推定や収量予測など、AIを活用した農業DX(デジタルトランスフォーメーション)発展の加速が期待できるとしている。