知识蒸馏代码(手写字MINST数据集实现)
简介
本仓库提供了一个简单的知识蒸馏实验代码,使用手写字MINST数据集进行实现。实验中,教师模型包含4个隐藏层,学生模型则包含2个隐藏层。此外,代码还展示了如何可视化知识蒸馏中的温度系数T对蒸馏效果的影响。
实验内容
- 教师模型:包含4个隐藏层,用于生成学生模型的学习目标。
- 学生模型:包含2个隐藏层,通过知识蒸馏从教师模型中学习。
- 温度系数T:通过调整温度系数T的大小,观察其对知识蒸馏效果的影响,并进行可视化展示。
使用方法
- 克隆仓库:将本仓库克隆到本地。
- 运行代码:按照代码中的说明,运行实验代码。
- 观察结果:通过可视化结果,观察温度系数T对知识蒸馏的影响。
注意事项
- 本实验为预实验,旨在展示知识蒸馏的基本原理和效果。
- 代码中包含详细的注释,方便理解和修改。
贡献
欢迎对本实验代码进行改进和优化,如有任何问题或建议,请提交Issue或Pull Request。
许可证
本仓库的代码遵循MIT许可证,详情请参阅LICENSE文件。