使用HuggingfacePEFT和LoRA训练大型语言模型LLM的demo代码

2024-06-19

使用Huggingface、PEFT和LoRA训练大型语言模型（LLM）的demo代码

本仓库提供了一个关于使用Huggingface、PEFT（Parameter-Efficient Fine-Tuning）和LoRA（Low-Rank Adaptation）训练大型语言模型（LLM）的demo代码。该资源文件包含几个关键脚本和设置，帮助用户在不同的平台上进行模型训练。

该脚本用于设置大部分所需的配置，特别适用于使用lambdalabs平台的用户。在使用该脚本之前，你需要创建一个名为.env的文件，并在其中包含以下三个条目：

这是一个用于训练LoRA模型的脚本。你可以通过查看该脚本的头部来调整一些关键设置，包括：

当前存在一个保存LoRA模型的问题，用户需要注意这一点。

欢迎对本仓库进行贡献，包括但不限于代码优化、问题修复和文档改进。请提交PR或提出Issue。

本项目采用MIT许可证，详情请参阅LICENSE文件。