計測データのメタ情報抽出ツールを開発し公開―AIや機械学習で利活用しやすいデータ形式に変換:物質・材料研究機構
(2019年1月29日発表)
(国)物質・材料研究機構は1月29日、メーカーや装置によって異なる材料データを、機械学習で利活用しやすいデータ形式に変換するツールを開発したと発表した。新材料開発促進への貢献が期待されるという。
開発したのは、計測装置より出力されるデータから、計測条件や試料情報などの、いわゆるメタ情報と呼ばれている情報を抽出し、機械可読性の高いXMLファイルへと変換するツール。
材料データを機械学習によって統計処理し、新材料の開発を目指すデータ駆動型の材料開発が近年注目されているが、統計処理の元となる計測データはメーカーや装置によって異なることが多く、データの相互比較が難しかったり、メタ情報の一部が欠けていてデータの検索が難しかったりするといった課題を抱えている。
物材研の研究グループは今回、X線光電子分光法とX線回折法の2種の計測データについて、計測機器メーカーのアルバック・ファイ(株)と(株)リガクの2社の協力を得て、メタ情報を付与するための用語変換を定義し、機械学習で主要となるパラメータを抽出するツールを開発した。
成果は“M-DaC”と命名して物材研究機構のNIMS-DPFCのウェブサイトに公開した。
引き続きメーカーの枠を広げるとともに、オープンソースソフトウェアを活用するなどしてデータ変換を可能にする技術分野を拡大し、変換ツールを順次公開していくという。