pytorch 优化器采取不同学习率

def configure_optimizers(self):params = list(model.named_parameters())def is_backbone(n): return 'bert' in ngrouped_parameters = [{"params": [p for n, p in params if is_backbone(n)], 'lr': args.lr},{"

不想待在银河系

972人浏览 · 2021-09-14 09:05:27

不想待在银河系 · 2021-09-14 09:05:27 发布


def configure_optimizers(self):
    params = list(model.named_parameters())

    def is_backbone(n): return 'bert' in n

    grouped_parameters = [
        {"params": [p for n, p in params if is_backbone(n)], 'lr': args.lr},
        {"params": [p for n, p in params if not is_backbone(n)], 'lr': args.lr * 100},
    ]

    optimizer = torch.optim.AdamW(
        grouped_parameters, lr=args.lr, weight_decay=0
    )

    return optimizer