大阪府立大学工学研究科電気・情報系専攻知能メディア処理研究室の大学院生、山田良博氏(博士後期課程1年)が開発したニューラルネットワークが、一般物体認識分野で世界一の認識精度を達成した。山田氏は2016年12月にも当時世界一の認識精度をもつ手法を提案。2017年5月、新たに提案されたニューラルネットワークによって一旦その座を奪われたが、今回、従来手法に比べて認識率を大幅に向上させたニューラルネットワークを開発し、再び世界一の認識精度を達成した。

 一般物体認識とは、「飛行機」や「自動車」、「鳥」、「猫」などの多様な物体を認識(分類)するタスク(処理の実行単位)のこと。近年は深層学習(ディープラーニング)で注目されているニューラルネットワークを用いた手法が主流となっており、主なものだけで過去約2年間に11度も記録が塗り替えられる熾烈な研究開発競争が繰り広げられている。

 2017年5月に山田氏の提案手法の記録を抜いたShake-Shakeという手法は、「学習を適度に妨害する」ことによってより高い性能を実現できることを示した新しい手法だったが、比較的浅いネットワークにしか適用できないという欠点があった。そこで山田氏は、Shake-Shakeの「学習を適度に妨害する」学習法を、深い構造を持つネットワークに適用できる形で実現。その過程で学習が安定する工夫も導入し、前回自身が提案して世界一の認識精度を達成した手法に適用した。その結果、認識率を大幅に向上させることに成功し、これまで世界一だった手法に約3%もの大差をつける88%の認識精度を達成した。

 この成果により、一般物体認識のタスクに限らず、画像に関連する様々なタスクへの大きな波及効果も期待されている。

大学ジャーナルオンライン編集部

大学ジャーナルオンライン編集部です。
大学や教育に対する知見・関心の高い編集スタッフにより記事執筆しています。