.. |
unsloth_compiled_cache
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
před 3 měsíci |
__init__.py
|
7270ddb56d
Initialize commit
|
před 3 měsíci |
check_pytorch_cuda.py
|
7270ddb56d
Initialize commit
|
před 3 měsíci |
conf_train.py
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
před 3 měsíci |
fine_tune_model.py
|
7270ddb56d
Initialize commit
|
před 3 měsíci |
generate_data.py
|
97fe68c387
更换unsloth grpo的训练数据集并验证
|
před 3 měsíci |
inference.py
|
9fa7a6263a
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
před 3 měsíci |
main.obj
|
7270ddb56d
Initialize commit
|
před 3 měsíci |
model_downloader.py
|
cd5cc43486
遵循面向对象思想重构train_model_grpo.py
|
před 3 měsíci |
quantize_model.py
|
c5fc011955
完善代码及说明
|
před 3 měsíci |
train_model_grpo.py
|
7196266feb
遵循面向对象思想重构train_model_grpo.py
|
před 3 měsíci |
train_model_grpo_v1.1.py
|
cd5cc43486
遵循面向对象思想重构train_model_grpo.py
|
před 3 měsíci |
train_model_grpo_v1.py
|
8f30a3f1e1
遵循面向对象思想重构train_model_grpo.py
|
před 3 měsíci |
train_model_grpo_v2.py
|
6b7ea96c64
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
před 3 měsíci |
train_model_sft.py
|
7982caa3ba
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
před 3 měsíci |