韓國首爾大學Yousung Jung、福特漢姆大學Joshua Schrier等報道機器學習能否應用預測水熱合成的晶體結構,并且解釋這些預測結果。
本文要點:
(1)
通過在人類可讀的目標晶體結構的文本描述上訓練微調大語言模型(LLM)達到與之前定制的卷積圖神經網絡方法相當的水平。但是,通過文本嵌入表示(text-embedding representation of the structure)上訓練一個正的未標記學習模型(positive-unlabeled learning model),可以實現更好的預測質量。
(2)
使用基于LLM的工作流,為控制可綜合性的因素類型生成人類可讀的解釋,提取其中物理規則,并評估這些規則的準確性。這些解釋可以指導化學家修改或優化不可合成的假設結構,使其在材料設計中更可行。
參考文獻
Seongmin Kim, Joshua Schrier, Yousung Jung, Explainable Synthesizability Prediction of Inorganic Crystal Polymorphs using Large Language Models, Angew. Chem. Int. Ed. 2025
DOI: 10.1002/anie.202423950
https://onlinelibrary.wiley.com/doi/full/10.1002/anie.202423950