东南大学王金兰教授团队在《自然通讯》上发表最新研究成果
近日,东南大学物理学院王金兰教授团队在数据驱动的新材料设计研究中取得新进展,研究成果以“From bulk effective mass to 2D carrier mobility accurate prediction via adversarial transfer learning”为题在国际期刊《自然通讯》(Nature Communications)上在线发表。
以机器学习为代表的数据驱动的研发方法机器学习已经成为了一种材料设计的新范式,其在数据量丰富的材料体系诸如钙钛矿、合金、催化材料等数据量较大的体系中已经能够实现了快速准确的性质预测。作为一种数据驱动的方法,机器学习模型的预测能力严重依赖数据的质量与数量,然而,高精度的材料性质数据非常有限,严重影响了机器学习模型的预测能力和适用范围。迁移学习是一种机器学习技术,通过从大数据(源域)迁移知识来提高学习器在小数据集(目标域)上的性能的机器学习技术,。迁移学习被认为是解决材料数据稀缺挑战的一种有效方法,但其需要有效性依赖于源域和与目标域间的有较高的相似性,因此目前大部分迁移学习方法通常只能用于同类材料不同性质间的迁移或相同性质不同材料间的迁移,而无法实现不同材料不同性质间的跨域迁移。在相同材料不同性质,或者不同材料相同性质中进行。
该工作开发了一套结合对抗式训练以及专家知识的混合迁移学习框架,其中对抗训练捕捉了块体和二维材料的共性特征,而专家知识的引入进一步提升了预测的准确性和泛化能力。该框架利用块体材料的有效质量数据,成功实现了对二维材料载流子迁移率的准确预测。预测流程仅需要材料晶体结构作为输入,相较于第一性原理计算,预测准确性达到90%,速度提升5个数量级。在此基础上,该工作成功筛选出21种载流子迁移率远超硅,、且带隙与硅近似的二维材料,为高集成度高性能的半导体器件提供了候选材料。混合迁移学习框架是处理小数据集问题的通用策略,该工作实现了不同材料不同性质间的跨域迁移,这项研究工作使迁移学习能够同时在同时跨不同性质和不同材料的场景中进行,为基于小数据集的复杂材料性质预测提供了有效工具。混合迁移学习框架是处理小数据集问题的通用策略,扩充了数据驱动材料设计方法的适用范围。
本文的第一作者是东南大学物理学院博士生陈新宇,东南大学物理学院王金兰教授及周跫桦副教授为通讯作者。该工作受到国家重点研发计划、国家自然科学基金等项目的资助。