.. |
unsloth_compiled_cache
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
il y a 2 mois |
__init__.py
|
7270ddb56d
Initialize commit
|
il y a 3 mois |
check_pytorch_cuda.py
|
7270ddb56d
Initialize commit
|
il y a 3 mois |
conf_train.py
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
il y a 2 mois |
fine_tune_model.py
|
7270ddb56d
Initialize commit
|
il y a 3 mois |
generate_data.py
|
97fe68c387
更换unsloth grpo的训练数据集并验证
|
il y a 3 mois |
inference.py
|
9fa7a6263a
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
il y a 3 mois |
main.obj
|
7270ddb56d
Initialize commit
|
il y a 3 mois |
model_downloader.py
|
cd5cc43486
遵循面向对象思想重构train_model_grpo.py
|
il y a 2 mois |
quantize_model.py
|
c5fc011955
完善代码及说明
|
il y a 3 mois |
train_model_grpo.py
|
7196266feb
遵循面向对象思想重构train_model_grpo.py
|
il y a 3 mois |
train_model_grpo_v1.1.py
|
cd5cc43486
遵循面向对象思想重构train_model_grpo.py
|
il y a 2 mois |
train_model_grpo_v1.py
|
8f30a3f1e1
遵循面向对象思想重构train_model_grpo.py
|
il y a 2 mois |
train_model_grpo_v2.py
|
6b7ea96c64
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
il y a 3 mois |
train_model_sft.py
|
7982caa3ba
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
il y a 3 mois |