关于pytorch中，dataloader中的num_work运行机制的理解

最近遇到一个问题，发现dataloader中数据加载异常的慢，慢慢的排查到了dataloader这一步，我以前一直以为num_work共同维护一个大小为batch size的队列，但是不是，它每次会开启num_work个线程，分别去加载dataset里面的数据，直到每个worker加载数据量为batch size 大小（num_work*batch_size）才会进行下一步训练。而不是我之前理解的

dxz_tust

4370人浏览 · 2020-06-02 20:05:15

dxz_tust · 2020-06-02 20:05:15 发布

最近遇到一个问题，发现dataloader中数据加载异常的慢，慢慢的排查到了dataloader这一步，我以前一直以为num_work共同维护一个大小为batch size的队列，但是不是，它每次会开启num_work个线程，分别去加载dataset里面的数据，直到每个worker加载数据量为batch size 大小（num_work*batch_size）才会进行下一步训练。而不是我之前理解的，只要总数据量达到batch size就立刻进行下一步训练。

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

cover

cursor实战经验分享

cover

从零开始的Scratch编程游戏教程：手把手教你快速上手

cover

阿里Coder AI编程助手深度测评：国产AI编程工具的崛起之路

所有评论(0)

查看更多评论

dxz_tust

已为社区贡献3条内容