熊本大学と印刷大手のTOPPANは、AI技術を融合させた光学文字認識で難易度の高いくずし字で書かれた文書を解読することに成功した。さらに、くずし字資料の解読システムと連動したキーワード検索システムを構築、必要な資料を即時に収集できるようにしている。

 熊本大学によると、解読に成功したのは、江戸時代に肥後国(現在の熊本県)を治めていた細川家の文書のうち、藩主細川忠利の命令を記録した「奉書」、参勤中の藩主が国元へ送った書状の控えの「御国御書案文」、惣奉行衆から発せられた書状の控えの「方々への状控」など合計約5万枚。

 東京都文京区で細川家に関する資料や武具などを公開している永青文庫から寄託を受けた貴重な歴史資料だが、難易度の高いくずし字で書かれているため、これまで解読できなかった。そこで、熊本大学とTOPPANはAI技術を融合させた光学文字認識を使ってくずし字を解読した。

 古文書は全国に数十億点残っているとされ、現代の社会課題に直結する災害や疫病、地域文化が細かく記録されている。しかし、現代人が読み取りにくいくずし字で書かれていることから、当時の記録を防災や観光資源の創出などに活用するのが難しい。

 TOPPANは2015年から国文学研究資料館と共同研究してくずし字を読み取れる光学文字認識技術の開発を進めてきた。新技術を搭載したキーワード検索システムの活用で古文書からの必要な情報収集が容易になり、研究を加速すると期待されている。

参考:【熊本大学】熊本大学とTOPPAN、くずし字AI-OCR活用した古文書の大規模調査のための独自手法を開発

熊本大学

真実や新しさを探求。熊本大学は「真のグローバル大学」をめざす

130年を超える長い歴史と伝統を持った熊本大学は、教育戦略に「旧制五高以来の剛毅木訥の気風を受け継ぎ、“Global Thinking and Local Action”できる人材育成」を掲げています。輝く未来のために新しい創造的な「知」が生まれ育ち、いかなる[…]

大学ジャーナルオンライン編集部

大学ジャーナルオンライン編集部です。
大学や教育に対する知見・関心の高い編集スタッフにより記事執筆しています。