如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
周的点点头:”“腾蛇”本身是一个攻击生成模型,虽然我们可以设置它最终的攻击目的,但是我们无法控制它达成这个目的的方式,这也就导致了,它可能生成互相矛盾,但是又能够达成相同目的的攻击方式。”
他指了指最近24小时『蛇”生成的新型攻击数据的特徵分布直方图,“这就能很明显地看得出来,最近的数据里,这些攻击的攻击模式非常的矛盾,我觉得这就是导致模型突然抽风的原因。”
眾人都不由地点了点头,这样的话,他们倒是能够理解了。
“那我们能不能给『蛇”加一些约束,让它別生成这么矛盾的数据?
周的摇了摇头:“约束会限制『腾蛇”的创造力,我们寧愿防御模型自己学会消化这些奇怪的数据,也不能让“腾蛇”的潜力被框住。”
除此之外,他还想到了一个非常重要的漏洞,之前无论什么模型都好,训练的数据集都是有限的,但是对这个模型来说,它的训练集是无限的,虽然现在没有出现『遗忘”问题,但是根据他的估计,迟早会发生的,早,晚的区別罢了。
“先把训练任务停一下,等会儿我发几个测试方案,你们跑一下。”周的將笔记本还给张工,快步走回办公室,准备对模型进行修改。
回到办公室,周的拿出一张白纸,开始写写画画,问题已经很清楚了,模型目前的架构无法消化特徵上存在矛盾的海量攻击数据,有一个非常简单的想法就是,多训练几个子模型,然后將结果匯总,这种方法固然简单,但周的不想用,这种方法治標治標不治本,多个子系统势必会带来参数量爆炸、决策延迟增加以及模型间责任分散的新问题。
很快他就想到了自己的毕业论文,既然连不同模態的数据都能映射到同一个高维空间,没道理网络流量不行,它们的数据形式甚至都是一样的。
思路逐渐清晰起来,一个个数学公式被他写到纸上。
大概写满了十几张之后,周昀放下笔:“应该可以了。”
又整理了一下思路,他开始將核心算法进行代码实现,几个小时后,他將重新设计的关键模块代码和说明发给了负责模型实现的工程师。
为了確保他们都能理解自己的思路,周的还特地拉著他们开了个会,算法中的很多参数都需要和模型的其他部分进行关联,如果不能完全理解他的算法,很有可能会出现问题。
经过了大概一天的修改,模型再次进行训练。
同样是四天之后,这次並没有发生上一次的『抽风”现象,损失函数下降得依旧很稳定。
大家看著大屏幕上实时更新的训练曲线,这次的曲线確实平滑了很多,堪称是非常的优雅!
“嗯,如果五天之后没有问题,就接入『玄武』平台吧,他们那边已经完成的差不多了。”
这个模型的运行模式比较特殊,它可以做到在线更新,也就是边训练,边使用,它无时无刻不在发生著进化。
五天后,模型的训练曲线依旧平稳,不过因为其本身性能已经很强了,哪怕还在继续训练,在测试集上也几乎看不见什么提升了。
“周总,验收通过了,可以准备接入了。
“好,按照原计划,將其接入『玄武”防御平台。”
整个接入大概需要半个月左右的时间,因为在模型完成接入之后还需要对整个模型进行各种测试,以保证其能够稳定运行,这个测试也是非常耗时间的。
测试完之后还有一个修改的阶段,这么大一个项目,代码里不可能一点没有bug,接下来的工作只会更加枯燥。
本章未完,点击下一页继续阅读。