如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
起初几天,效果似乎立竿见影。模型生成的候选结构中,那些明显不合理的数量锐减,提交到dft计算环节的任务通过率显著提高。
然而,就在陈默准备在周一的组会上匯报这个好消息时,一个尖锐的问题浮出水面。
负责分析dft结果的一名博士生发现,最近几批通过筛选的结构,虽然几何上看似合理,但其电子结构却呈现出一种令人不安的平庸。
它们大多是结构极其稳定、带隙过宽或过窄的绝缘体或导体,几乎不具备作为功能材料的潜力。
换句话说,“万象”似乎学会了一种取巧的方式:为了避免生成“垃圾”,它倾向於生成那些能量极低、极其稳定、但也毫无用处的“超级稳定结构”。
简单来说就是过擬合了。
“老板,情况有点不对劲。”陈默在组会前匆匆找到周昀,展示了分析结果,“过滤器的確拦住了垃圾,但也好像把创造力”一起过滤掉了。
万象”在走向保守,它现在输出的结构,像是经过精心修饰的標准答案”,缺乏创新。”
周昀盯著屏幕上的能带结构图和形成能数据,眉头渐渐锁紧。他预见到优化之路会有波折,但没料到居然会是过擬合的问题。
组会上,气氛变得有些凝重。陈默匯报了筛选率提升的数据,但也坦诚了”
结构平庸化”的新问题。
“这意味著,我们的物理规则过滤器”可能过於强势,或者说,我们给万象”设定的优化目標太单一了——仅仅追求低能量和稳定性。”
周昀一针见血地指出,“它就像一个只会背诵教科书的好学生,能避开所有错误答案,却答不出有创见的题目。”
这甚至还没有原版的万象”好用,所谓的改进完全是负优化。
所有人的心都沉了下去。他们夜以继日的工作,换来的竟是比原始模型更糟糕的结果,短暂的沉默后,周昀敲了敲桌子,將眾人的注意力拉回。
“现在不是沮丧的时候。我们诊断出了问题—一过擬合。那么,解决方案是什么?”
他目光扫过算法组的成员,最后落在陈默身上。“陈默,你认为问题根源在哪里?除了目標函数单一。”
陈默冷静下来后盯著屏幕,快速分析:“我认为有两个层面。第一,正如您所说,优化目標过於强调稳定性和低形成能,相当於给了模型一个强烈的避错”指令,它自然会选择最保守、最安全的路径。
第二,我们灌入的高质量”数据,可能本身就偏向於已知的、稳定的结构类別,模型从中学到的知识”范围太窄,缺乏对未知、亚稳態但可能具备特殊功能的结构的探索。”
“很好。”周昀点头,“所以,我们需要在规则”和自由”之间找到一个平衡点。不仅要告诉模型什么是错”的,更要引导它去发现什么是好”的,甚至是意想不到”的好。”
这个与监督的思想有点类似,但是又不完全一样,他站起身,再次走向白板,擦掉了之前的部分流程图。
“第一,立刻调整损失函数。引入功能潜力作为核心优化目標之一,设立一个创造性奖励机制。
对於生成的结构,只要其电子结构显示出我们预设的、有价值的功能特徵,如適中的带隙、高的態密度有效质量、特定的能带形状,即使其形成能不是最低的,也应该获得高评分。”
“第二,调整训练数据。不能只餵给它標准答案。我们需要刻意加入一些经过验证的、具有特殊性质的亚稳材料数据,甚至是一些看似怪异”但在特定条件下成立的结构,拓宽它的视野”。”
“第三,”周昀笔尖一顿,“在对抗性验证环节,给验证器增加新的评判维度。不仅要判断结构是否合理,还要评估其功能潜力。让万象”明確知道,仅仅存活下来是不够的,必须展现出价值。”
“周老师,这样修改,模型的收敛速度可能会大大降低,而且搜索空间会爆炸性增长,计算成本————”
“我们现在要的不是快速收敛到一个错误的局部最优,而是要以足够的耐心,找到那条通往真正创新的路径,效率暂时下降可以接受,但方向必须正確。”
他看向陈默:“工程线配合,重新配置计算资源,优先保障新算法的测试和叠代。
另外,数据组立刻开始筛选和准备包含亚稳相和功能材料的特殊数据集。”
任务分配下去,实验室再次高速运转起来,重构算法和数据集花费了將近一周时间。首次测试那天,所有人都屏息凝神。
新的“万象”模型开始生成候选结构。与之前相比,生成的结构明显变得更加多样,甚至有些看起来“大胆”了许多。
然而,隨之而来的是dft计算任务的激增,以及更高的失败率。许多结构在几何优化阶段就崩溃了,或者计算出匪夷所思的电子性质。
陈默看著监控平台上跳动的失败提示,眉头紧锁,改进版的“万象”似乎从一个极端走向了另一个极端——创造力有了,但稳定性急剧下降。
连续几天,进展缓慢。筛选率不仅没有提升,反而因为大量结构在dft验证环节失败而有所回落,团队內部开始出现一些焦躁的情绪。
就在此时,周昀做出了一个决定。他叫停了大规模的结构生成测试。
“我们陷入了另一个误区。”他在晚间的小范围討论会上说,“创造性不是漫无目的的隨机发散。我们需要给这种创造”加上一个锚点,基於物理规律的探索。”
他提出了一个全新的概念:“在物理规则过滤器”和功能潜力评估”之间,增加一个结构可行性预测”模块。这个模块不追求绝对精確,而是利用一个轻量级的神经网络,快速预测生成的结构在dft几何优化中的存活概率”。
让万象”在生成阶段,就能有一个初步的、基於经验的手感”,知道往哪个方向创造”更容易產出物理上可信的结构。”
这是一个巧妙的折中方案,相当於给天马行空的创意加了一个符合工程实际的“韁绳”。
算法的叠代进入了一个更复杂的阶段。团队成员们围绕著“结构可行性预测”模块的设计和训练,展开了激烈的討论,陈默协调著资源,確保这个新模块能儘快集成到主流程中。
本章未完,点击下一页继续阅读。