zhouyang.xie 5064049d71 增加 RAG 技术验证 2 周之前
..
unsloth_compiled_cache 526921091e 修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考 2 月之前
__init__.py 7270ddb56d Initialize commit 3 月之前
check_pytorch_cuda.py 7270ddb56d Initialize commit 3 月之前
conf_train.py f9dc2bb16f 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 月之前
dataset_download.py 4995352642 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 月之前
fine_tune_model.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 月之前
generate_data.py f8443b3682 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 2 月之前
inference.py 7b5779cba9 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 月之前
main.obj 7270ddb56d Initialize commit 3 月之前
model_downloader.py 5064049d71 增加 RAG 技术验证 2 周之前
model_rag.md 5064049d71 增加 RAG 技术验证 2 周之前
model_rag.py 5064049d71 增加 RAG 技术验证 2 周之前
quantize_model.py c5fc011955 完善代码及说明 3 月之前
train_model_github_jwjohns.py 3f8e53e024 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 月之前
train_model_grpo_original.py 77168b22a2 遵循面向对象思想重构train_model_grpo.py 3 月之前
train_model_grpo_v0.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 月之前
train_model_grpo_v1.1.py 73be517bb5 修改 风电机组数据集格式 2 月之前
train_model_grpo_v1.2.py 98d070b8c5 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 月之前
train_model_grpo_v1.py 8f30a3f1e1 遵循面向对象思想重构train_model_grpo.py 3 月之前
train_model_sft.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 月之前