zhouyang.xie/unsloth_deepseek @ 8d19984abd065f89ff1387ba4d78c386f8115fb1

zhouyang.xie 8d19984abd 遵循面向对象思想重构train_model_grpo.py		há 9 meses atrás
..
unsloth_compiled_cache	9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	há 9 meses atrás
__init__.py	7270ddb56d Initialize commit	há 9 meses atrás
check_pytorch_cuda.py	7270ddb56d Initialize commit	há 9 meses atrás
conf_train.py	ad874737a9 遵循面向对象思想重构train_model_grpo.py	há 9 meses atrás
fine_tune_model.py	7270ddb56d Initialize commit	há 9 meses atrás
generate_data.py	97fe68c387 更换unsloth grpo的训练数据集并验证	há 9 meses atrás
inference.py	9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	há 9 meses atrás
main.obj	7270ddb56d Initialize commit	há 9 meses atrás
model_downloader.py	c5fc011955 完善代码及说明	há 9 meses atrás
quantize_model.py	c5fc011955 完善代码及说明	há 9 meses atrás
train_model_grpo.py	7196266feb 遵循面向对象思想重构train_model_grpo.py	há 9 meses atrás
train_model_grpo_v1.py	8d19984abd 遵循面向对象思想重构train_model_grpo.py	há 9 meses atrás
train_model_grpo_v2.py	6b7ea96c64 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	há 9 meses atrás
train_model_sft.py	7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题	há 9 meses atrás