|
1234567891011121314151617181920212223242526272829303132333435363738394041424344 |
- # 模型库
- # 1. 图像分类
- ## 1.1 量化
-
- ## 1.2 剪枝
-
- 数据集:Cifar10
-
- 模型:Alexnet、Lenet
-
- 设置:剪枝率为0.5、0.7
-
- | 模型 - 剪枝算子 | 测试次数 | Acc | 剪枝率 | 压缩比例 | 推理耗时samples/s |
- | :---------------------: | :------: | :----: | :----: | :------: | :---------------: |
- | Alexnet - 无剪枝 | 5 | 94.89% | - | 1x | 5409 |
- | Alexnet - bn | 5 | 98.81% | 50% | 1.4x | 5968 |
- | Alexnet - conv_all | 5 | 93.95% | 50% | 1.3x | 5969 |
- | Alexnet - conv_avg | 5 | 98.56% | 50% | 1.3x | 5865 |
- | Alexnet - conv_max | 5 | 97.44% | 50% | 1.3x | 5555 |
- | Alexnet - random | 5 | 97.32% | 50% | 1.3x | 5580 |
- | Alexnet -conv_threshold | 5 | 98.03% | 50% | x1.3x | 5567 |
- | Lenet - 无剪枝 | 5 | 75.72% | - | 1x | 5821 |
- | Lenet - bn | 5 | 64.89% | 70% | 3x | 1923 |
-
- # 2. 文本分类
- ## 2.1 知识蒸馏
- 数据集:SST-2
-
- 环境:单卡2080Ti
-
- 设置:BERT类模型最大序列长度设为128,LSTM类模型最大序列长度设为32,词表大小为10000
-
- | 模型 | 测试次数 | Acc | 层数 | 隐藏层维度/前馈层维度 | 模型尺寸 | 压缩比例 | 推理耗时 | 推理加速 |
- |:--:|:---:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
- | BERT_base(Teacher) | 5 | 92.2% | 12 | 768/3072 | 110M | 1x | 4.04s | 1x |
- | KD | 5 | 80.5% | 3 | 312/1200 | 14.5M | 7.5x | 0.81s | 5.0x |
- | BiLSTM | 5 | 80.4% | 1 | 300/400 | 15.3M | 7.2x | 0.83s | 4.8x |
- | Distilled-BiLSTM | 5 | 82.9% | 1 | 300/400 | 15.3M | 7.2x | 0.83s | 4.8x |
- | BERT-PKD(from scratch) | 5 | 81.5% | 3 | 768/3072 | 45.7M | 2.4x | 1.69s | 2.4x |
- | BERT-PKD | 5 | 88.4% | 3 | 768/3072 | 45.7M | 2.4x | 1.69s | 2.4x |
- | TinyBERT | 5 | 91.3% | 4 | 312/1200 | 14.5M | 7.5x | 0.65s | 6.2x |
- | BERT-of-Theseus | 5 | 87.2% | 4 | 768/3072 | 53.7M | 2.05x | 2.05s | 2.0x |
-
- 注:层数不包含embedding和prediction层。
|