zhouyang.xie 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 пре 3 месеци
..
unsloth_compiled_cache 73a5634a5e 遵循面向对象思想重构train_model_grpo.py пре 3 месеци
__init__.py 7270ddb56d Initialize commit пре 3 месеци
check_pytorch_cuda.py 7270ddb56d Initialize commit пре 3 месеци
conf_train.py 2275fcf164 遵循面向对象思想重构train_model_grpo.py пре 3 месеци
fine_tune_model.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 пре 3 месеци
generate_data.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 пре 3 месеци
inference.py 73a5634a5e 遵循面向对象思想重构train_model_grpo.py пре 3 месеци
main.obj 7270ddb56d Initialize commit пре 3 месеци
model_downloader.py 71cb307569 遵循面向对象思想重构train_model_grpo.py пре 3 месеци
quantize_model.py c5fc011955 完善代码及说明 пре 3 месеци
train_model_grpo_original.py 77168b22a2 遵循面向对象思想重构train_model_grpo.py пре 3 месеци
train_model_grpo_v0.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 пре 3 месеци
train_model_grpo_v1.1.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 пре 3 месеци
train_model_grpo_v1.py 8f30a3f1e1 遵循面向对象思想重构train_model_grpo.py пре 3 месеци
train_model_sft.py 91bb641d42 遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码 пре 3 месеци