约 394,000 个结果
在新选项卡中打开链接
  1. 什么是Checkpoint? 在 机器学习 和 深度学习 中,checkpoint(检查点)是指在模型训练过程中保存的模型状态。 这些检查点通常包括模型的参数(权重和偏置)、优化器状态和其他相关的训练信息。 通过保存检查点,您可以在训练过程中定期保存模型的当前状态,以便在需要时恢复训练或用于模型评估和推理。
    blog.csdn.net/Flemington7/article/details/139026499
    Checkpoint是用于描述在每次训练后保存模型参数(权重)的惯例或术语。 这就像在游戏中保存关卡时你可以随时通过加载保存文件回复游戏。 你可以加载保存的模型权重重新开启训练甚至可以之后进行一个推理。 复杂模型的训练阶段通常很长(数小时到数天到数周)。
    zhuanlan.zhihu.com/p/410548507
  2. 其他用户还问了以下问题
  3. Gradient Checkpointing(梯度检查点) - 知乎

  4. 在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型 - 知乎

  5. accelerator.sync_gradients - CSDN博客

  6. 检查点 - Hugging Face 中文

  7. PyTorch 之 Checkpoint 机制解析 - 知乎

  8. 分布式检查点 (DCP) 入门 — PyTorch 教程 2.5.0+cu124 文档 ...

  9. DeepSpeed 通用检查点:实用指南 - DeepSpeed 中文

  10. 什么是Checkpoint?_checkpoint模型-CSDN博客

  11. 使用 CRIU 实现 CUDA 应用程序检查点 - NVIDIA 技术博客

  12. 某些结果已被删除