東京大学大学院の高道慎之介助教らの研究チームは、東映株式会社ツークン研究所からの受託研究において、歌手の松任谷由実氏が50年前にデビューした当時の歌声を人工再現する技術を開発した。
日本の歌謡文化は、欧米の歌謡文化にリアルタイムに影響されながらニューミュージックや日本独自のJ-POP文化を形成しており、文化間の作用が新たな文化を生み出してきた。同様に、貴重な音資料を現代の音質で再現できれば新たな文化の創出に寄与できる。
今回研究グループは、音楽家としてニューミュージック時代から現代まで第一線で活躍する松任谷由実氏の50年前の歌声の人工的再現を目指した。現存するデビュー当時の音資料は少なく歌声再現に適した資料ではないため、従来の情報工学技術では困難であった。
そこで研究グループは、テキストから話声を合成する「テキスト音声合成」、歌詞から歌声を合成する「歌声合成」、ある歌声を当時の歌声に変換する「歌声変換」を一括で機械学習できる「多段階合成変換タスク混合学習アルゴリズム」を用いた。また、機械学習に不要なデータを半自動的に削除する「データ編集・枝刈り法」も採用。これにより、当時の声色と歌唱表現を、現代に対応する音質で新しい楽曲上に再現することに成功した。
再現された歌声はデビュー当時のアーティスト名「荒井由実」として、松任谷由実氏の現在の歌声とデュエットを行い、楽曲「Call me back」のミュージックビデオ(MV)としてYouTubeで一般公開(2022年10月1日)された。
今回の研究成果の活用で、今後過去の歌声・音声データと現在の文化との相互作用による歌謡の新たな創作方法や鑑賞方法が生まれることが期待されるとしている。
参考:【東京大学大学院 情報理工学系研究科】時を超えて蘇る50年前の歌声 ――スモールデータを用いたタスク混合深層学習による歌唱再現――(PDF)