zhouyang.xie cd5cc43486 遵循面向对象思想重构train_model_grpo.py há 2 meses atrás
..
unsloth_compiled_cache 2275fcf164 遵循面向对象思想重构train_model_grpo.py há 2 meses atrás
__init__.py 7270ddb56d Initialize commit há 3 meses atrás
check_pytorch_cuda.py 7270ddb56d Initialize commit há 3 meses atrás
conf_train.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py há 2 meses atrás
fine_tune_model.py 7270ddb56d Initialize commit há 3 meses atrás
generate_data.py 97fe68c387 更换unsloth grpo的训练数据集并验证 há 3 meses atrás
inference.py 9fa7a6263a 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 3 meses atrás
main.obj 7270ddb56d Initialize commit há 3 meses atrás
model_downloader.py cd5cc43486 遵循面向对象思想重构train_model_grpo.py há 2 meses atrás
quantize_model.py c5fc011955 完善代码及说明 há 3 meses atrás
train_model_grpo.py 7196266feb 遵循面向对象思想重构train_model_grpo.py há 2 meses atrás
train_model_grpo_v1.1.py cd5cc43486 遵循面向对象思想重构train_model_grpo.py há 2 meses atrás
train_model_grpo_v1.py 8f30a3f1e1 遵循面向对象思想重构train_model_grpo.py há 2 meses atrás
train_model_grpo_v2.py 6b7ea96c64 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 3 meses atrás
train_model_sft.py 7982caa3ba 修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题 há 3 meses atrás