.. |
unsloth_compiled_cache
|
526921091e
修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考
|
2 kuukautta sitten |
__init__.py
|
7270ddb56d
Initialize commit
|
3 kuukautta sitten |
check_pytorch_cuda.py
|
7270ddb56d
Initialize commit
|
3 kuukautta sitten |
conf_train.py
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
3 kuukautta sitten |
fine_tune_model.py
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 kuukautta sitten |
generate_data.py
|
f8443b3682
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
3 kuukautta sitten |
inference.py
|
73a5634a5e
遵循面向对象思想重构train_model_grpo.py
|
3 kuukautta sitten |
main.obj
|
7270ddb56d
Initialize commit
|
3 kuukautta sitten |
model_downloader.py
|
8603d51a1c
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
2 kuukautta sitten |
quantize_model.py
|
c5fc011955
完善代码及说明
|
3 kuukautta sitten |
qwen_notebook_clone.py
|
742973debf
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
|
2 kuukautta sitten |
train_model_grpo_original.py
|
77168b22a2
遵循面向对象思想重构train_model_grpo.py
|
3 kuukautta sitten |
train_model_grpo_v0.py
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 kuukautta sitten |
train_model_grpo_v1.1.py
|
73be517bb5
修改 风电机组数据集格式
|
3 kuukautta sitten |
train_model_grpo_v1.2.py
|
526921091e
修改train_model_grpo_v1.2.py 试图恢复模型训练自我思考
|
2 kuukautta sitten |
train_model_grpo_v1.py
|
8f30a3f1e1
遵循面向对象思想重构train_model_grpo.py
|
3 kuukautta sitten |
train_model_sft.py
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 kuukautta sitten |