pytorch 中detach() 和 with torch.no_grad()和eval()

detach()和torch.no_grad()都可以实现相同的效果，只是前者会麻烦一点，对每一个变量都要加上，而后者就不用管了:- detach() 会返回一个新的Tensor对象，不会在反向传播中出现，是相当于复制了一个变量，将它原本requires_grad=True变为了requires_grad=False- torch.no_grad() 通常是在推断(inference)的时候，用来

Cater Chen

1375人浏览 · 2021-07-23 16:57:24

Cater Chen · 2021-07-23 16:57:24 发布

detach() 和 torch.no_grad() 都可以实现相同的效果，只是前者会麻烦一点，对每一个变量都要加上，而后者就不用管了:

- detach() 会返回一个新的Tensor对象，不会在反向传播中出现，是相当于复制了一个变量，将它原本requires_grad=True变为了requires_grad=False

- torch.no_grad() 通常是在推断(inference)的时候，用来禁止梯度计算，仅进行前向传播。在训练过程中，就像画了个圈，来，在我这个圈里面跑一下，都不需要计算梯度，就正向传播一下。

而model.eval()和torch.no_grad()两者都用，因为两者有着不同的作用：

- torch.no_grad()：在autograd中禁用梯度跟踪

- model.eval()：更改所调用模块的forward()行为。例如，它禁用dropout，并使用测试时bn norm

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

cover

探索AI编程新纪元：从零开始的智能编程之旅

cover

当 AI 学会“造沙箱“：OpenSandbox 如何让大模型安全地执行代码

cover

Comate Zulu+Al赋能：独立开发者2天打造跨平台邮箱插件全记录

所有评论(0)

查看更多评论

Cater Chen

@sinat_28375239

已为社区贡献1条内容