DOI: 10.1039/d3dd00055a
期刊: Digital Discovery
发表年份: 2023
图1: (a) 闪蒸石墨烯(FG)和无定形碳的Raman光谱;(b-e) I2D/IG、ID/IG、2D带FWHM和FG产率的统计分布;(f-g) I2D/IG与FG产率的相关性;(h) 四种起始材料的FG产率分布;(i) 产率统计比较;(j) 特征的t-SNE图。
分析结果: Raman光谱显示FG具有G峰(~1580 cm⁻¹)和2D峰(~2700 cm⁻¹),表明石墨晶格形成。统计分布显示FG产率均值为54%,标准差27%。I2D/IG与FG产率高度相关(Pearson r=0.73),而ID/IG依赖性较小。不同起始材料的产率有显著差异,CB产率最高(72%),MC最低(37%)。t-SNE分析表明参数组合可实现最高产率。
图2: 提出的SML框架示意图和数据流,包括多物理模拟温度、预测电流参数、前体信息和直接FJH参数作为最终ML模型的输入。
分析结果: 该框架整合了直接实验参数和物理信息特征,通过代理模型预测电流参数,多物理模拟温度,最终使用这些特征训练ML模型预测FG产率。框架避免了依赖中间参数,提高了通用性和准确性。
图3: (a) 代表性电流-时间图及衍生的电流参数;(b-d) 预测与真实电流参数的分布比较,包括IMax、IF/IMax和CDIT,并显示Pearson r值。
分析结果: 代理模型能准确预测电流参数,Pearson r值分别为0.80(IMax)、0.78(IF/IMax)和0.77(CDIT),表明仅使用直接参数即可预测中间变量,无需实验测量电流-时间曲线。
图4: ML模型预测FG产率的性能。(a) R²得分和(b) RMSE of six ML models with five train-test splits; (c) XGBoost模型预测与真实值比较;(d) 预测产率的相对误差分布;(e-f) 排除T_Sim和电流参数后的预测结果。
分析结果: XGBoost模型性能最佳,平均R²为0.81 ± 0.05,RMSE为12.1% ± 2.0%。71%的预测误差≤10%,仅11%误差>20%。排除物理信息特征后,模型性能下降(R²降至0.74),验证了这些特征的重要性。
图5: 最终XGBoost模型的输入特征分析。(a) 输入特征的定量相关图;(b) 特征重要性排名;(c-d) CD₀和T_Sim与预测FG产率的相关性。
分析结果: 特征重要性排名显示CD₀和T_Sim是最重要的特征,解释了模型准确性的关键原因。CD₀阈值约为100 C g⁻¹,用于实现>50%的FG产率。T_Sim超过阈值时,产率显著提高,支持高温对反应结果的决定性作用。