新エネルギー・産業技術総合開発機構(NEDO)が推進する福祉用具の実用化開発支援事業で、IT大手のヒューマンテクノシステムと東北大学は、発話障害者の声を明瞭な発音に変換する新技術を開発した。ヒューマンテクノシステムは研究成果の一部を第116回電子情報通信学会・福祉情報工学研究会で発表しており、咽頭がんや筋委縮性側索硬化症(ALS)などで声を失った人の生活の質向上に朗報となりそうだ。
NEDOによると、新技術は東北大学が開発した声質変換技術の機能を拡張し、健常者の音声を発話障害者の音声に変換することで発話障害者が自分らしい音声で話せるようにした。音声の生成にはこれまで、大量のデータが必要だったが、限られたデータでも高品質の音声生成を可能にした。
発話障害者用の福祉機器としてあらかじめ録音した自分の音声データを用いて任意のテキストを読み上げる個人音声合成器があるが、現在の機器は録音した音声を忠実に再現する機能しかなく、発音が不明瞭だと合成器の音声も不明瞭になる欠点を持っている。
そこで、ヒューマンテクノシステムと東北大学は音声の特徴から音声波形を生成する技術の導入や学習データの前処理など工夫を重ね、明瞭な高品質の音声生成に成功した。ヒューマンテクノシステムは複数拠点で実証実験を続け、2023年度の実用化を目指している。
出典:【新エネルギー・産業技術総合開発機構】障害のある話者の声で明瞭な発音を生成する技術を開発 ―発話障害者の個人音声合成器の活用を後押しし、生活の質(QOL)を向上―