阿里巴巴通义千问大模型源码下载

2023-09-26

阿里巴巴通义千问大模型源码下载

资源文件介绍

阿里巴巴通义千问大模型源码

通义千问-7B（Qwen-7B） 是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型，在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在Qwen-7B的基础上，我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。

模型特点

大规模高质量预训练数据：使用了超过2.2万亿token的自建大规模预训练数据集进行语言模型的预训练。数据集包括文本和代码等多种数据类型，覆盖通用领域和专业领域。
优秀的模型性能：相比同规模的开源模型，Qwen-7B在多个评测数据集上具有显著优势，甚至超出12-13B等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等。
更好地支持多语言：基于更大词表的分词器在分词上更高效，同时它对其他语言表现更加友好。用户可以在Qwen-7B的基础上更方便地训练特定语言的7B语言模型。
8K的上下文长度：Qwen-7B及Qwen-7B-Chat均能支持8K的上下文长度。

使用说明

本仓库提供了Qwen-7B模型的源码下载，用户可以根据需要进行二次开发和定制。源码中包含了模型的训练代码、预处理脚本以及模型推理的相关代码。

注意事项

请确保在下载和使用源码前，已经阅读并理解了相关的使用协议和许可条款。
由于模型规模较大，建议在具备足够计算资源的条件下进行训练和推理。
如有任何问题或建议，欢迎通过GitHub Issues进行反馈。

贡献指南

我们欢迎社区的贡献者参与到Qwen-7B模型的开发和优化中来。如果您有任何改进建议或代码贡献，请遵循以下步骤：

Fork本仓库。
创建新的分支进行开发。
提交Pull Request，并详细描述您的修改内容和目的。
等待审核和合并。

感谢您对阿里巴巴通义千问大模型项目的支持！

下载链接

阿里巴巴通义千问大模型源码下载