京都大学大学院情報学研究科の河原達也教授らの研究グループは、消滅危機言語に認定されているアイヌ語の音声を自動認識し、合成する人工知能(AI)を開発した。アイヌ語の音声認識・合成システム構築は初めてで、アイヌ語の伝承や学習に効果を上げそうだ。
京都大学によると、研究グループは北海道白老町のアイヌ民族博物館、北海道平取町の町立二風谷アイヌ文化博物館から提供を受けた計10人、約40時間の民話の音声データ提供を受け、音節を単位として用いた深層学習でAIが94%の音素認識率、80%の単語認識率を達成した。
これにより、1時間のデータに対し、人の手で1日かかる作業がほぼ完全に自動化でき、アイヌ語のアーカイブ構築が大きく効率化することになった。
さらに、提供された音声データのうち、1人当たりで10時間以上会話している人について、AIの深層学習で音声を合成した。9月に白老町で開かれたアイヌ語アーカイブ研究会で実演したところ、博物館関係者から好評を得た。
アイヌ語は北海道や樺太、千島列島などに居住していたアイヌの言語で、口承だけで伝えられてきた。科学的な研究は明治時代以降にスタートしたが、樺太や千島列島では話者がすでに消滅したとされる。北海道の話者数は1996年の調査で15人、2007年の調査で10人まで減少、ユネスコが2009年、極めて深刻な消滅の危機にあると認定した。