zhouyang.xie 87845c5b5d 修改train_model_grpo.py代码,验证GRPO训练模型,设置训练轮数 参数 num_train_epochs 4 місяців тому
..
unsloth_compiled_cache ca5fe63b52 完善README.MD说明 4 місяців тому
__init__.py 7270ddb56d Initialize commit 4 місяців тому
check_pytorch_cuda.py 7270ddb56d Initialize commit 4 місяців тому
fine_tune_model.py 7270ddb56d Initialize commit 4 місяців тому
generate_data.py e2a3b8ab23 2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序; 4 місяців тому
inference.py d3713ffe46 验证GRPO 训练的模型推理 4 місяців тому
main.obj 7270ddb56d Initialize commit 4 місяців тому
model_downloader.py c5fc011955 完善代码及说明 4 місяців тому
quantize_model.py c5fc011955 完善代码及说明 4 місяців тому
train_model.py a1f825a642 将临时输出移除git的管理 4 місяців тому
train_model_grpo.py 87845c5b5d 修改train_model_grpo.py代码,验证GRPO训练模型,设置训练轮数 参数 num_train_epochs 4 місяців тому