You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

model_zoo.md 2.2 kB

1234567891011121314151617181920212223242526272829303132333435363738394041424344
  1. # 模型库
  2. # 1. 图像分类
  3. ## 1.1 量化
  4. ## 1.2 剪枝
  5. 数据集:Cifar10
  6. 模型:Alexnet、Lenet
  7. 设置:剪枝率为0.5、0.7
  8. | 模型 - 剪枝算子 | 测试次数 | Acc | 剪枝率 | 压缩比例 | 推理耗时samples/s |
  9. | :---------------------: | :------: | :----: | :----: | :------: | :---------------: |
  10. | Alexnet - 无剪枝 | 5 | 94.89% | - | 1x | 5409 |
  11. | Alexnet - bn | 5 | 98.81% | 50% | 1.4x | 5968 |
  12. | Alexnet - conv_all | 5 | 93.95% | 50% | 1.3x | 5969 |
  13. | Alexnet - conv_avg | 5 | 98.56% | 50% | 1.3x | 5865 |
  14. | Alexnet - conv_max | 5 | 97.44% | 50% | 1.3x | 5555 |
  15. | Alexnet - random | 5 | 97.32% | 50% | 1.3x | 5580 |
  16. | Alexnet -conv_threshold | 5 | 98.03% | 50% | x1.3x | 5567 |
  17. | Lenet - 无剪枝 | 5 | 75.72% | - | 1x | 5821 |
  18. | Lenet - bn | 5 | 64.89% | 70% | 3x | 1923 |
  19. # 2. 文本分类
  20. ## 2.1 知识蒸馏
  21. 数据集:SST-2
  22. 环境:单卡2080Ti
  23. 设置:BERT类模型最大序列长度设为128,LSTM类模型最大序列长度设为32,词表大小为10000
  24. | 模型 | 测试次数 | Acc | 层数 | 隐藏层维度/前馈层维度 | 模型尺寸 | 压缩比例 | 推理耗时 | 推理加速 |
  25. |:--:|:---:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
  26. | BERT_base(Teacher) | 5 | 92.2% | 12 | 768/3072 | 110M | 1x | 4.04s | 1x |
  27. | KD | 5 | 80.5% | 3 | 312/1200 | 14.5M | 7.5x | 0.81s | 5.0x |
  28. | BiLSTM | 5 | 80.4% | 1 | 300/400 | 15.3M | 7.2x | 0.83s | 4.8x |
  29. | Distilled-BiLSTM | 5 | 82.9% | 1 | 300/400 | 15.3M | 7.2x | 0.83s | 4.8x |
  30. | BERT-PKD(from scratch) | 5 | 81.5% | 3 | 768/3072 | 45.7M | 2.4x | 1.69s | 2.4x |
  31. | BERT-PKD | 5 | 88.4% | 3 | 768/3072 | 45.7M | 2.4x | 1.69s | 2.4x |
  32. | TinyBERT | 5 | 91.3% | 4 | 312/1200 | 14.5M | 7.5x | 0.65s | 6.2x |
  33. | BERT-of-Theseus | 5 | 87.2% | 4 | 768/3072 | 53.7M | 2.05x | 2.05s | 2.0x |
  34. 注:层数不包含embedding和prediction层。

一站式算法开发平台、高性能分布式深度学习框架、先进算法模型库、视觉模型炼知平台、数据可视化分析平台等一系列平台及工具,在模型高效分布式训练、数据处理和可视分析、模型炼知和轻量化等技术上形成独特优势,目前已在产学研等各领域近千家单位及个人提供AI应用赋能