libtorch技巧 2025年07月03日 0 使用float16计算配置optims.eps(1e-5);可以避免梯度计算nan 使用amp混合精度可以减小内存使用 推理是建议使用torch::NoGradGuard避免梯度计算导致内存暴涨 显卡内存不够可以加载数据集到内存每次复制到显存里面计算