机器学习笔记六——模型压缩

系列文章目录机器学习笔记一—机器学习基本知识机器学习笔记二—梯度下降和反向传播机器学习笔记三—卷积神经网络与循环神经网络机器学习笔记四—机器学习可解释性机器学习笔记五—机器学习攻击与防御机器学习笔记六—模型压缩文章目录系列文章目录前言一、模型压缩的意义二、模型压缩的方法1、网络剪枝（Network Pruning）2、知识蒸馏（Knowledge Distillation）3、参数量化（Param

江_小_白

1600人浏览 · 2021-08-29 16:22:24

江_小_白 · 2021-08-29 16:22:24 发布

系列文章目录

文章目录

系列文章目录
前言
一、模型压缩的意义
二、模型压缩的方法
总结

前言

这一节我们介绍模型压缩

一、模型压缩的意义

当我们将深度学习模型真正应用于实际生活中的时候需要考虑的一个重要的问题就是模型的计算量和模型大小，当我们将模型放入手机、智能手表之类的设备上时，我们所使用的模型所需的存储空间不能太大，计算量也不能太大，所以我们要进行模型压缩

二、模型压缩的方法

1、网络剪枝（Network Pruning）

实际上我们所训练的模型存在着很多冗余，有很多神经元根本就没有起到作用，所以我们要将这一部分的神经元“剪枝”

首先训练一个模型
评估神经元或者权重参数的重要性（可以直接比较权重的数值，越接近于零的越不重要）
移除不重要的参数
用剪枝后的模型继续训练微调，观察剪枝后模型效果，如果模型效果不好或者模型参数仍旧过大，则返回第二步
那么我们为什么不直接训练小模型，因为一般来说小模型比较难以训练，而较大的模型比较好训练。
而对于去掉神经元和去掉权重参数这两种方式，一般来说我呢不会选择去掉权重参数，因为去掉权重参数会导致计算不平衡，也就是权重参数不能构成一个矩阵，这样的情况下实际上并不能提高计算速度也不能减小参数存储空间（存储参数的时候实际上大多是补零存储，所谓的剪枝根本没有起到作用）