摘 要
回顾了从手册到数据库的材料数据活动的历史和现状,并介绍了一些重要的产品。通过基于数据和数据科学方法预测界面热阻的实例,我们展示了材料信息学在采用过于复杂或耗时的传统理论和实验方法研究材料的领域方面的优势和潜力。材料大数据是材料信息学的基础。在本文中讨论了构建材料大数据的挑战和策略,并根据我们构建国家材料科学研究所(NIMS)材料数据库的经验,提出了一些解决方案。
关键词
材料数据库,大数据,材料信息学,机器学习,界面热阻,材料识别。
部分附图
图1:材料数据技术的发展
图2: 实验值和预测值:( a )声失配理模型( AMM )和( b )扩散失配模型( DMM )之间的关联
图3:实验值与高斯过程回归预测结果的相关性
图4:材料识别系统的四个层次。
图5: 描述 SiC/Ti 复合材料的层次结构示例
图6: 材料识别信息管理系统的概念
图7:单相材料识别记录的XML框架
结 论
数据科学正在成为处理试验耗时和理论计算方法过于复杂的材料问题的重要且有效的方法。材料数据即时基础,也是限制科学创新的瓶颈所在。为了构建材料大数据,我们面临各类挑战,包括最新数据收集,长期数据保护,数据共享和最大利用率等。幸运的是,所有材料现象下的物理和化学定律都可以帮助我们减少所需的数据量。本文基于构建NIMS材料数据库的经验,提出了一些解决方案。已经得到证明的一个成功例子是通过机器学习方法预测界面热阻性能。
相关软件产品
iDataInsight
iDataInsight(材料机器学习系统)是一个构建机器学习模型与应用机器学习模型的平台,通过融合材料信息学、机器学习技术,加速材料研发与应用,助力高技术用户进行材料发现、结构分析、性质预测及反向设计。iDataInsight通过灵活选取数据源,采用合适的模型进行训练与优化,实现对“材料-成分-工艺-组织-性能-服役”规律的可视化探究与发现。
iDataInsight可以实现连接数据源、使用数据源训练模型、使用模型进行预测的机器学习全流程一站式使用。同时平台依托AutoML自动调参等技术手段,大大简化了训练流程,使没有机器学习相关知识的使用人员亦可方便训练出效果良好的模型。