LLaMA-Factory

GitHub官网：GitHub - hiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM)

距离开始接触大语言模型已经有几个月的时间了，当初就知道“微调”这个高频词汇，一直没机会弄（一是机器不行，同时也没有比较小的模型；二是感觉应该不好弄，往后拖，先忙别的，哈哈），直到写这篇笔记的前几天才开始尝试，第一次使用LLaMA Factory微调还是挺顺利的，只能说这框架太牛了，比想象中省事儿不少……微调成功，很兴奋啊！

环境准备

物理环境是：Ubuntu 22.04 + Intel(R)Xeon(R) CPU E5-2699 v4 2.20GHZ + RAM（512GB）

项目下载

这里下载的是最新（2024-02-27）的发行版：0.5.2，将项目放到了这里，如下图：

LLaMA-Factory 项目本地存放位置

微调数据集

关于自定义数据集的写法以及一些配置你可以参照官网的：LLaMA-Factory/data/README_zh.md at main · hiyouga/LLaMA-Factory · GitHub

LLaMA-Factory 项目之数据准备，官方截图

自己整理了几条数据作为测试数据集，文件名称为ddz001.json，放到了LLaMA-Factory-0.5.2/data文件夹下，如图：

LLaMA-Factory 项目之自定义数据集

点击下载数据集：ddz001.json

还需要在同目录的dataset_info.json文件中添加对自定义数据集的描述，如下：

LLaMA-Factory 项目之自定义数据集添加到 dataset_info.json

虚拟环境和安装依赖

#   创建
python3 -m venv venv
#   激活
source ./venv/bin/activate
#   退出虚拟环境
deactivate

pip install -r requirements.txt

创建并激活虚拟环境；安装依赖

deepseek-coder

deepseek-coder用他来开启微调的第一枪

模型下载

由于计算机资源比较紧张，所以下载了个1.3b的，下载路径为：/home/xxx/llm/0-model/deepseek-ai/deepseek-coder-1.3b-instruct

git lfs install
git clone https://modelscope.cn/deepseek-ai/deepseek-coder-1.3b-instruct.git

指令监督微调

开始微调

CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \
    --stage sft \
    --do_train \
    --model_name_or_path /home/xxx/llm/0-model/deepseek-ai/deepseek-coder-1.3b-instruct \
    --dataset ddz001 \
    --template deepseekcoder \
    --finetuning_type lora \
    --lora_target q_proj,v_proj \
    --output_dir output-ddz/deepseek-coder-1.3b-instruct \
    --overwrite_cache \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --lr_scheduler_type cosine \
    --logging_steps 5 \
    --save_steps 1000 \
    --learning_rate 3e-3 \
    --num_train_epochs 30.0 \
    --plot_loss \
    --fp16

在官网微调示例的基础上，主要对下面的几个参数做了修改

model_name_or_path: 要微调的模型的ID或者路径。这里使用的是已经下载好的模型，所以写的是绝对路径
dataset: 数据集。这里用的是上面提到的ddz001
template 、 lora_target: 不同的模型这两个参数的值可能不一样，你可以参考：LLaMA-Factory/README_zh.md at main · hiyouga/LLaMA-Factory · GitHub
output_dir: 输出路径
logging_steps、learning_rate、num_train_epochs: 这几个参数可以根据实际情况调一下（不知所以然）

LLaMA-Factory 微调 deepseek-coder-1.3b-instruct 开始

LLaMA-Factory 微调 deepseek-coder-1.3b-instruct 结束

导出模型

python src/export_model.py \
    --model_name_or_path /home/xxx/llm/0-model/deepseek-ai/deepseek-coder-1.3b-instruct \
    --adapter_name_or_path output-ddz/deepseek-coder-1.3b-instruct \
    --template deepseekcoder \
    --finetuning_type lora \
    --export_dir /home/xxx/llm/0-model/xxx/xxx-deepseek-coder-1.3b-instruct \
    --export_size 2 \
    --export_legacy_format False

LLaMA-Factory 微调 deepseek-coder-1.3b-instruct 之后，导出

推理测试

这里测试的问题是：“javascript 基于时间戳的唯一标识符实现”

微调前

deepseek-coder-1.3b-instruct 推理：javascript 基于时间戳的唯一标识符实现

微调后

deepseek-coder-1.3b-instruct 微调后推理：javascript 基于时间戳的唯一标识符实现