zhouyang.xie 5064049d71 增加 RAG 技术验证 hace 2 semanas
..
unsloth_compiled_cache 526921091e 修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考 hace 2 meses
__init__.py 7270ddb56d Initialize commit hace 3 meses
check_pytorch_cuda.py 7270ddb56d Initialize commit hace 3 meses
conf_train.py f9dc2bb16f 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hace 2 meses
dataset_download.py 4995352642 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hace 2 meses
fine_tune_model.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 hace 2 meses
generate_data.py f8443b3682 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 hace 2 meses
inference.py 7b5779cba9 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hace 2 meses
main.obj 7270ddb56d Initialize commit hace 3 meses
model_downloader.py 5064049d71 增加 RAG 技术验证 hace 2 semanas
model_rag.md 5064049d71 增加 RAG 技术验证 hace 2 semanas
model_rag.py 5064049d71 增加 RAG 技术验证 hace 2 semanas
quantize_model.py c5fc011955 完善代码及说明 hace 3 meses
train_model_github_jwjohns.py 3f8e53e024 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hace 2 meses
train_model_grpo_original.py 77168b22a2 遵循面向对象思想重构train_model_grpo.py hace 3 meses
train_model_grpo_v0.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 hace 2 meses
train_model_grpo_v1.1.py 73be517bb5 修改 风电机组数据集格式 hace 2 meses
train_model_grpo_v1.2.py 98d070b8c5 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 hace 2 meses
train_model_grpo_v1.py 8f30a3f1e1 遵循面向对象思想重构train_model_grpo.py hace 3 meses
train_model_sft.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 hace 2 meses