llamafactory-cli
命令行工具接口,它是 LLaMA-Factory v3 版本引入的新特性,用于简化常用操作(训练、推理、导出等)。下面是 llamafactory-cli
的命令大全 和每个子命令的说明:
命令总览:llamafactory-cli
命令大全
llamafactory-cli [command] [options]
常用主命令:
命令 | 说明 |
---|---|
env |
显示环境信息(PyTorch、CUDA、transformers 等) |
train |
启动模型训练(封装了 src/train_bash.py ) |
merge |
合并 LoRA 模型权重为 HuggingFace 模型 |
cli |
启动命令行交互测试 |
webui |
启动 Web UI 推理界面 |
export |
导出模型为 GGUF 或 Safetensors |
convert |
转换数据格式为标准训练集 |
validate |
验证数据集格式是否正确 |
chat |
在命令行中与模型多轮对话 |
clean |
清理缓存、训练中间结果 |
build |
构建 tokenizer/config 结构 |
详细命令说明
1. 查看环境信息
# llamafactory-cli env
- `llamafactory` version: 0.9.3.dev0
- Platform: Linux-5.15.0-131-generic-x86_64-with-glibc2.39
- Python version: 3.12.3
- PyTorch version: 2.6.0a0+df5bbc09d1.nv24.12 (GPU)
- Transformers version: 4.51.3
- Datasets version: 3.5.0
- Accelerate version: 1.6.0
- PEFT version: 0.15.1
- TRL version: 0.9.6
- GPU type: NVIDIA GeForce RTX 3080
- GPU number: 2
- GPU memory: 9.68GB
输出当前环境状态:PyTorch 版本、CUDA、transformers、peft 等依赖库信息。
2. 启动训练任务
llamafactory-cli train --config ./configs/sft.yaml
使用 YAML 配置文件进行训练(更规范的方式)。
3. 命令行对话
llamafactory-cli cli --model_name_or_path path_to_model
使用你训练好的模型进行命令行聊天。
4. 启动 Web UI
llamafactory-cli web --model_name_or_path path_to_model --share
用浏览器打开图形界面测试模型,可以选择 --share
开公网链接。
5. 合并 LoRA 模型
llamafactory-cli merge \
--base_model base_model_path \
--lora_model lora_adapter_path \
--output_dir merged_model_path
6. 导出为 GGUF(用于 llama.cpp)
llamafactory-cli export \
--model_name_or_path merged_model_path \
--format gguf \
--quantization q4_0 \
--output_dir ./gguf_model
7. 数据集转换为 Alpaca / ChatML 等格式
llamafactory-cli convert \
--input_file ./data/raw.json \
--output_file ./data/converted.json \
--format alpaca
8. 验证数据格式是否正确
llamafactory-cli validate \
--input_file ./data/converted.json
9. 多轮对话测试(Chat 模式)
llamafactory-cli chat --model_name_or_path path_to_model
10. 清理缓存或输出路径
llamafactory-cli clean
11. 构建 tokenizer 和 config(高级用法)
llamafactory-cli build --model_type llama --output_dir ./model
查看完整帮助
llamafactory-cli --help # 总帮助
llamafactory-cli train --help # 某个命令的详细参数说明
小结
类型 | 示例 |
---|---|
查看环境 | llamafactory-cli env |
训练模型 | llamafactory-cli train --config xxx.yaml |
推理测试 | llamafactory-cli cli / web / chat |
合并模型 | llamafactory-cli merge |
导出模型 | llamafactory-cli export --format gguf |
数据工具 | convert , validate |
清理缓存 | llamafactory-cli clean |