筑波大学計算科学研究センター北川博之教授らの研究グループは、ソーシャルネットワーク(以下SNS)などにおけるネットワークのビッグデータ分析において、ノード(ユーザ)が持つ年齢や性別といった属性ラベルから未知のラベルを推定する新技術を開発。米国で開催された2016 SIAM International Conference on Data Miningにて発表された。

 情報化の進展に伴い、社会で飛び交うデータ量は爆発的に増加している。そんな中、ビッグデータの利活用が強く求められており、特に多くの有益な情報を内包するネットワークデータをいかに活用するかが重要視されている。

 例えばSNSではそれぞれのノードが対応するユーザの年齢や居住地などを「属性ラベル」として付与することができるが、中にはそれらがはっきりと示されていないノードも存在する。ノードの内容を紐とく上で重要な補足情報となるラベル情報を探るためには、ネットワークデータ中の既知のラベルから未知のラベルを推定する「ラベル推定」が必要とされ、これまでもさまざまな手法が開発されてきた。ただし、これらは異なるラベルを持つノード同士がつながりやすいネットワークデータには適用できないという問題があった。

 今回提案された手法は、基本の考え方として従来の「割合」に加え「絶対数」も考慮し、「信頼度」に比例した量の手がかりを周辺に伝え広げて、ラベル推定を行う。その結果、隣接ノードからの手がかりの量(信頼度)も考慮でき、異なるラベルを持つノード同士がつながりやすいネットワークデータも扱うことができるとしている。実験結果では、提案された手法はこれまでの主流のものより高い精度を示しているという。

 従来の推定処理に「信頼度」という概念を導入することで、本研究成果ではより高精度のラベル推定が可能となる。今後、実社会のビッグデータとの連携活用を考えたとき、ユーザの属性を推定する上で革新的な技術となることが期待されている。

筑波大学

学際融合・国際化への挑戦を続け、知性と人間性を備えた人材を育成

学問文化の薫り高い国際都市、筑波サイエンス・シティの中核となる緑あふれる筑波大学。現在の教育体制は9学群・23学類、全ての分野から専門導入的な科目を履修することができ、創造的な知性と豊かな人間性を備えることをめざしています。師魂理才をもって、地球規模課題の解決[…]

大学ジャーナルオンライン編集部

大学ジャーナルオンライン編集部です。
大学や教育に対する知見・関心の高い編集スタッフにより記事執筆しています。