如遇到章节错误,请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,稍后尝试刷新。
“嗯......特徵维度贡献方差过大?”划动滚轮的手指停下,周昀敏锐地看到了一条异常的输出。
说人话就是,模型在融合信息的时候没有一个轻重缓急,对所有模態的数据都一视同仁,平等对待了所有输入。
这在模態少的时候可能適用,因为数据输入之前,在无形之中其实是多了一个人工筛选的步骤。
比如你要预测股票的涨跌,相比於各种专家的视频分析,你可能会更加相信各种金融指標,所以你就会下意识地选择各种数字指標输入模型,而不是专家的视频分析。
这就隱含地为数据赋予了权重,虽然代码里没有,但它確实是真实存在的。
不过人工筛选终究是有一些小问题的,在金融这个反人类的领域,光凭经验很多时候容易做出错误的判断。
“也就是说,在数据融合的时候,缺少了一个『智能筛选』的步骤,让模型知道,哪些数据重要,哪些数据不重要。”
“数据筛选.......”周昀手指轻轻敲打著桌面,思考著解决办法。
如果只是单纯的逻辑判断,肯定不行,这样太死板,还不如人来筛选。
置信度?
周昀想了一下,也觉得不行。
置信度其实就是模型对自己输出结果的把握大小,例如一个分类任务,最终模型的输出会在softmax函数的作用下,变成一连串的概率,
比如分类到a的概率为80%,b任务的概率为10%以此类推。
那么置信度就是採用概率大於一定数值的结果。
这东西听上去玄乎,实际上也是一种比较死板的逻辑判断。
除了这两种,筛选数据的方法其实还有很多,不过周昀都不满意,因为这些方法从他们的底层逻辑来看,都没有达到他想要看到的“智能”。
突然,周昀手指一顿。
如果从另一方面来看,数据筛选,还可以看作是一种数据蒸馏。
数据蒸馏其实很好理解,蒸馏大家都知道,那么数据蒸馏就是通过某种手段將数据集提纯的方法。
恰好,周昀发在neurips上的agileedge这篇论文里就有一种数据蒸馏的方法,因为想要缩小模型,就等於缩小参数量,两者之间其实有著异曲同工之妙。
直接拿过来用肯定不行,不过周昀感觉只要稍作修改,应该能达到他想要的效果,因为当初设计这种数据蒸馏方法的时候,就已经著眼於“智能”二字。
找到之前的论文代码,周昀直接將那段封装好的数据蒸馏方法copy过来,然后再根据现有的模型进行修改。
因为代码量不大,他就没有用ai,而且ai也未必能准確理解他要怎么改,不如自己动手。
直到晚上快到六点,他才靠著椅子,伸了个懒腰。
终於改完了。
划动著滑鼠滚轮,看著已经成功运行的代码,他心里涌现出一股巨大的满足感。
这就是科研的爽感来源,当你解决了一个难题之后所带来的快感,是其他任何事情都不能带给你的。
等了一会儿,直到確认第一个epoch顺利开始后,周昀断开了与伺服器的连接。
他在伺服器上设置了几组实验,这次跑完估计得要两周,不过他也可以趁著这段时间放鬆一下。
如果顺利的话,之前那件事情,也差不多该迎来一个结局了。
本章未完,点击下一页继续阅读。