zhouyang.xie 742973debf 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 kuukautta sitten
..
unsloth_compiled_cache 526921091e 修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考 2 kuukautta sitten
__init__.py 7270ddb56d Initialize commit 3 kuukautta sitten
check_pytorch_cuda.py 7270ddb56d Initialize commit 3 kuukautta sitten
conf_train.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py 3 kuukautta sitten
fine_tune_model.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 kuukautta sitten
generate_data.py f8443b3682 修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 3 kuukautta sitten
inference.py 73a5634a5e 遵循面向对象思想重构train_model_grpo.py 3 kuukautta sitten
main.obj 7270ddb56d Initialize commit 3 kuukautta sitten
model_downloader.py 8603d51a1c 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 kuukautta sitten
quantize_model.py c5fc011955 完善代码及说明 3 kuukautta sitten
qwen_notebook_clone.py 742973debf 换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型 2 kuukautta sitten
train_model_grpo_original.py 77168b22a2 遵循面向对象思想重构train_model_grpo.py 3 kuukautta sitten
train_model_grpo_v0.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 kuukautta sitten
train_model_grpo_v1.1.py 73be517bb5 修改 风电机组数据集格式 3 kuukautta sitten
train_model_grpo_v1.2.py 526921091e 修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考 2 kuukautta sitten
train_model_grpo_v1.py 8f30a3f1e1 遵循面向对象思想重构train_model_grpo.py 3 kuukautta sitten
train_model_sft.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 3 kuukautta sitten