熊本大学と印刷大手のTOPPANは、AI技術を融合させた光学文字認識で難易度の高いくずし字で書かれた文書を解読することに成功した。さらに、くずし字資料の解読システムと連動したキーワード検索システムを構築、必要な資料を即時に収集できるようにしている。
熊本大学によると、解読に成功したのは、江戸時代に肥後国(現在の熊本県)を治めていた細川家の文書のうち、藩主細川忠利の命令を記録した「奉書」、参勤中の藩主が国元へ送った書状の控えの「御国御書案文」、惣奉行衆から発せられた書状の控えの「方々への状控」など合計約5万枚。
東京都文京区で細川家に関する資料や武具などを公開している永青文庫から寄託を受けた貴重な歴史資料だが、難易度の高いくずし字で書かれているため、これまで解読できなかった。そこで、熊本大学とTOPPANはAI技術を融合させた光学文字認識を使ってくずし字を解読した。
古文書は全国に数十億点残っているとされ、現代の社会課題に直結する災害や疫病、地域文化が細かく記録されている。しかし、現代人が読み取りにくいくずし字で書かれていることから、当時の記録を防災や観光資源の創出などに活用するのが難しい。
TOPPANは2015年から国文学研究資料館と共同研究してくずし字を読み取れる光学文字認識技術の開発を進めてきた。新技術を搭載したキーワード検索システムの活用で古文書からの必要な情報収集が容易になり、研究を加速すると期待されている。