「ビッグデータの時代」といわれる現代。膨大なデータから新たな価値を創出するデータサイエンスの素養を身につけた人材は、今や世界中から引く手数多となっている。しかし全ての最新技術が人々を幸せにするとは限らない。その技術を真に社会課題の解決に役立てるには、ビジネスや倫理などあらゆる観点からの検討が不可欠だ。一橋大学では、データサイエンスに加え、経営学、経済学、法学、政治学といった社会科学の知見を持つソーシャル・データサイエンスのゼネラリストを育成すべく、2023年4月、新学部をスタートさせた。
新たな技術を使いながら社会へ実装するには
社会科学&データサイエンスの融合が鍵
「新しい技術があれば何でもできると考えがちですが、私たちは常にその技術が及ぼす影響を見定める必要があります」こう警鐘を鳴らすのは、情報・AI分野での研究を行う小町守教授だ。
「最近ではChatGPTに関して複数の大学が声明を発表しましたが、これは様々な懸念があるからです。たとえばAIが生成したテキストが著作権を侵害していないか、差別的な文言や個人情報を含んでいないかといったことが挙げられますが、こうした問題に取り組むにはエンジニアリングだけでは不可能で、社会科学の知見が必要です」
特に近年は技術開発のスピードが著しい。深層学習(ChatGPTやGoogle翻訳に用いられている手法)が注目されはじめた2010年ごろには、研究から社会実装まで10~20年かかるといわれていた。しかし2016年登場のGoogle翻訳の開発期間は約2年、ChatGPTでは約1年と新技術が世に広まるまでの期間が格段に短くなっている。
「これまでは技術先行で、法規制や社会受容性の議論は後を追いかけるかたちでした。しかしこれからは新しい技術を使いながら諸問題に対処していくことになるでしょう。だからこそデータサイエンスと社会科学、双方の知見を持った人材が求められるのです」
人工知能の自然言語処理に新展開
品質評価が最新の研究テーマに
AIの進歩は目を見張るものがあるが、ソーシャル・データサイエンス学部ではどのような研究への展開が考えられるのだろうか。
「私の専門分野は計算言語学・自然言語処理ですが、深層学習は自然言語処理の研究に大きなインパクトを与えました。従来の統計的手法では集めたデータをただつなぐだけで、その不自然さから人間の仕事でないとわかりました。一方、深層学習ではデータを流暢につなぐことができます。細かく見ると不自然さや誤りがあっても、人間は滑らかに見えるものを高く評価する傾向があるので、それが正しく思えてしまうのです。そこで私たちは「人間がどのように文章を評価しているのか」をテーマに研究をしています。これは世界的にも最先端の取り組みです」
また、深層学習はひとつのシステムで多様な言語や用途に対応できる点も大きい。これまでは、日本語と英語、日本語と中国語など対応する言語ごとに専用の翻訳システムが必要だったのに対し、ChatGPTに代表される生成AIはひとつのシステムで多言語を扱う。さらに翻訳だけでなく、議事録作成やブレインストーミング、プログラミングといった様々な仕事をこなすこともできる。
「私たちの研究グループのあるプロジェクトでは、文法や意味の解析をする手法の研究を行っています。従来は言語ごとの辞書や複雑なルールを与えなければ解析できませんでしたが、深層学習では一つのシステムでシンプルかつ高速に解析できるのです」
小町教授自身、大学で哲学や歴史を学んだのち、コンピュータによる言語解析の可能性を追求したいと大学院で理系に転じた経験を持つ。最初は数学に苦戦したそうだが、文系と理系の双方を学んだ経験が今の研究にも生きているという。
「人工知能分野は日進月歩です。そんな中でも何十年も変わらないような根本原理の発見や、後に大きく発展していくような先駆的な研究を手掛けていきたいですね」
社会科学とデータサイエンスを融合させることで、社会課題やビジネスの革新に貢献する
社会に意味のある問いを立てる力を身につけ、
PBLを通じてデータサイエンス力の習熟を図る
学びのカリキュラムでは、「ビジネス」「社会課題」「データサイエンス」の3つの領域を体系的に学ぶことを卒業要件に掲げている。
受講科目は、大きく「社会科学」と「データサイエンス」に分けられる。社会科学では、経営学、経済学、法学、政治学など、他学部との共通科目も多く選択肢が豊富だ。一橋大学では他学部の講義の履修が推奨されており、学部学科を超えて、専門性の高い学びを得られる環境が整っている。データサイエンスでは、導入レベルの数理・情報系の授業科目と「統計学」「情報・AI」「プログラミング」などを体系的に学ぶ。高校数学の理解が欠かせないが、基礎から知識を得られるようにカリキュラムが組み立てられている。
また、3年次にはPBL(Project Based Learning)演習がある。演習では、実社会のデータを題材に学生たち自身で問いを立て、データを解析しながら何らかの合意を見出し、課題解決方法を検討、社会実装するまでを考える。まず、社会にとって意味のある問いを立てることが重要だが、そのカギは2年次までに学ぶ社会科学の講義のなかにある。データサイエンスの講義で学んだデータ収集・解析の習熟も大きな目的だ。演習には、企業や官公庁でデータサイエンスに携わる実務者も参加。学生のプレゼンテーションに対し、実際に社会の役に立ちそうか、経済学や倫理学などの観点で見て実現可能であるかなどのフィードバックが行われるという。
「料理に例えると、データサイエンスは包丁などの道具で、社会科学の知見やデータは食材です。包丁は正しく使わないと危険ですが、道具と食材が揃ってこそおいしい料理ができあがります。ソーシャル・データサイエンス学部では道具と食材のどちらも扱います。ぜひ教員や先輩と交流しながら学び、同期や後輩と共に新しい分野を切り拓いて欲しいと思います」
一橋大学 ソーシャル・データサイエンス学部
小町守教授