pytorch交叉熵损失输出为负数怎么解决

2025-01-07 技术教程

这篇文章将为大家详细讲解有关pytorch交叉熵损失输出为负数怎么解决，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

网络训练中，loss曲线非常奇怪

交叉熵怎么会有负数。

经过排查，交叉熵不是有个负对数吗，当网络输出的概率是0-1时，正数。可当网络输出大于1的数，就有可能变成负数。

所以加上一行就行了

out1 = F.softmax(out1, dim=1)

补充知识：在pytorch框架下，训练model过程中，loss=nan问题时该怎么解决？

当我在UCF-101数据集训练alexnet时，epoch设为100，跑到三十多个epoch时，出现了loss=nan问题，当时是一脸懵逼，在查阅资料后，我通过减小学习率解决了问题，现总结一下出现这个问题的可能原因及解决方法：

1. 减小整体学习率。学习率比较大的时候，参数可能over shoot了，结果就是找不到极小值点；减小学习率可以让参数朝着极值点前进；

2. 改变网络宽度。有可能是网络后面的层参数更新异常，增加后面层的宽度试试；

3. 改变层的学习率。每个层都可以设置学习率，可以尝试减小后面层的学习率试试；

4. 数据归一化（减均值，除方差，或者加入normalization，例如BN、L2 norm等）；

5. 加入gradient clipping；

6 输入数据含有脏数据，即NaN,一般当使用实际业务的真实数据时，容易出现脏数据。

关于pytorch交叉熵损失输出为负数怎么解决就分享到这里了，希望以上内容可以对大家有一定的帮助，可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到。

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系本站删除。