第34章数据融合异常

科研系学霸佚名加入书签错误举报

如遇到章节错误，请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能，稍后尝试刷新。

“嗯......特徵维度贡献方差过大？”划动滚轮的手指停下，周昀敏锐地看到了一条异常的输出。

说人话就是，模型在融合信息的时候没有一个轻重缓急，对所有模態的数据都一视同仁，平等对待了所有输入。

这在模態少的时候可能適用，因为数据输入之前，在无形之中其实是多了一个人工筛选的步骤。

比如你要预测股票的涨跌，相比於各种专家的视频分析，你可能会更加相信各种金融指標，所以你就会下意识地选择各种数字指標输入模型，而不是专家的视频分析。

这就隱含地为数据赋予了权重，虽然代码里没有，但它確实是真实存在的。

不过人工筛选终究是有一些小问题的，在金融这个反人类的领域，光凭经验很多时候容易做出错误的判断。

“也就是说，在数据融合的时候，缺少了一个『智能筛选』的步骤，让模型知道，哪些数据重要，哪些数据不重要。”

“数据筛选.......”周昀手指轻轻敲打著桌面，思考著解决办法。

如果只是单纯的逻辑判断，肯定不行，这样太死板，还不如人来筛选。

置信度？

周昀想了一下，也觉得不行。

置信度其实就是模型对自己输出结果的把握大小，例如一个分类任务，最终模型的输出会在softmax函数的作用下，变成一连串的概率，

比如分类到a的概率为80%，b任务的概率为10%以此类推。

那么置信度就是採用概率大於一定数值的结果。

这东西听上去玄乎，实际上也是一种比较死板的逻辑判断。

除了这两种，筛选数据的方法其实还有很多，不过周昀都不满意，因为这些方法从他们的底层逻辑来看，都没有达到他想要看到的“智能”。

突然，周昀手指一顿。

如果从另一方面来看，数据筛选，还可以看作是一种数据蒸馏。

数据蒸馏其实很好理解，蒸馏大家都知道，那么数据蒸馏就是通过某种手段將数据集提纯的方法。

恰好，周昀发在neurips上的agileedge这篇论文里就有一种数据蒸馏的方法，因为想要缩小模型，就等於缩小参数量，两者之间其实有著异曲同工之妙。

直接拿过来用肯定不行，不过周昀感觉只要稍作修改，应该能达到他想要的效果，因为当初设计这种数据蒸馏方法的时候，就已经著眼於“智能”二字。

找到之前的论文代码，周昀直接將那段封装好的数据蒸馏方法copy过来，然后再根据现有的模型进行修改。

因为代码量不大，他就没有用ai，而且ai也未必能准確理解他要怎么改，不如自己动手。

直到晚上快到六点，他才靠著椅子，伸了个懒腰。

终於改完了。

划动著滑鼠滚轮，看著已经成功运行的代码，他心里涌现出一股巨大的满足感。

这就是科研的爽感来源，当你解决了一个难题之后所带来的快感，是其他任何事情都不能带给你的。

等了一会儿，直到確认第一个epoch顺利开始后，周昀断开了与伺服器的连接。

他在伺服器上设置了几组实验，这次跑完估计得要两周，不过他也可以趁著这段时间放鬆一下。

如果顺利的话，之前那件事情，也差不多该迎来一个结局了。

本章未完，点击下一页继续阅读。

www.74txts.com

科研系学霸所有内容均来自互联网，骑士小说网只为原作者佚名的小说进行宣传。欢迎各位书友支持佚名并收藏科研系学霸最新章节。

第34章数据融合异常

推演，道成元始

清冷直男，被疯批皇帝强制爱了

天幕宝可梦：曝光小智弒神救世！

穿越菩提老祖，西游第一劫难

我有了透视眼之后，运气好到爆

开局青云宗主，召唤大帝境老祖

第34章 数据融合异常

推演，道成元始

清冷直男，被疯批皇帝强制爱了

天幕宝可梦：曝光小智弒神救世！

穿越菩提老祖，西游第一劫难

我有了透视眼之后，运气好到爆

开局青云宗主，召唤大帝境老祖

第34章数据融合异常