libtorch技巧

0

  • 使用float16计算配置optims.eps(1e-5);可以避免梯度计算nan
  • 使用amp混合精度可以减小内存使用
  • 推理是建议使用torch::NoGradGuard避免梯度计算导致内存暴涨
  • 显卡内存不够可以加载数据集到内存每次复制到显存里面计算