About 42,800,000 results
Open links in new tab
  1. 深度学习的loss一般收敛到多少? - 知乎

    看题主的意思,应该是想问,如果用训练过程当中的loss值作为衡量深度学习模型性能的指标的话,当这个指标下降到多少时才能说明模型达到了一个较好的性能,也就是将loss作为一 …

  2. 关于短语at a loss的用法? - 知乎

    牛津高阶上,给出的用法是be at a loss for words 和I'm at a loss what to do next. (后例也出现在…

  3. 损失函数|交叉熵损失函数 - 知乎

    对所有样本的loss求平均: 我们发现,MSE能够判断出来 模型2 优于 模型1,那为什么不采样这种损失函数呢?

  4. 大模型sft为什么第二个epoch的时候loss会突然下降? - 知乎

    Loss surfaces of a ResNet-56 (Li et al, 2018) 很可能预训练的大型语言模型在接近最小损失的区域具有非常平滑的损失面,而开源社区在这一区域进行的大量微调工作。 这基于围绕2018 …

  5. 大模型优化利器:RLHF之PPO、DPO

    Jan 21, 2025 · 最终,我们可以得出 DPO 的 loss 如下所示: 这就是 DPO 的 loss。 DPO 通过以上的公式转换把 RLHF 巧妙地转化为了 SFT,在训练的时候不再需要同时跑 4 个模型(Actor …

  6. 究竟什么是损失函数 loss function? - 知乎

    如何设计loss函数? Loss函数和你任务的评价准则越相关,二者越接近越好。 如果你任务的评价准则是F1-score(不可导),但一直在使用CrossEntropy Loss来迭代模型,二者之间虽然相关 …

  7. 深度学习的loss一般收敛到多少? - 知乎

    深度学习的loss一般收敛到多少? 计算机视觉的图像L2损失函数,一般收敛到多少时,效果就不错了呢? 显示全部 关注者 110

  8. 深度学习中loss和accuracy的关系? - 知乎

    loss 的具体形式取决于机器学习任务的类型。 例如,在回归问题中,常用的 loss 函数包括平方损失、绝对损失和对数损失;在分类问题中,常用的 loss 函数包括交叉熵损失和 Hinge 损失。

  9. 什么是「过拟合」,如何判断,常见的原因是什么? - 知乎

    1. 什么是过拟合? 过拟合是机器学习模型的常见问题之一。它指的是模型在训练数据上表现得非常好,但在未见过的测试数据中表现不佳。可以理解为某学生题海战术做太多了,平时都是原题 …

  10. 深度学习的多个loss如何平衡? - 知乎

    多个loss引入 pareto优化理论,基本都可以涨点的。 例子: Multi-Task Learning as Multi-Objective Optimization 可以写一个通用的class用来优化一个多loss的损失函数,套进任何方法 …

Refresh