zhouyang.xie
|
d6429d6a79
遵循面向对象思想重构train_model_grpo.py
|
пре 3 месеци |
zhouyang.xie
|
2a20ead66c
遵循面向对象思想重构train_model_grpo.py
|
пре 3 месеци |
zhouyang.xie
|
1a610f237b
遵循面向对象思想重构train_model_grpo.py
|
пре 3 месеци |
zhouyang.xie
|
7196266feb
遵循面向对象思想重构train_model_grpo.py
|
пре 3 месеци |
zhouyang.xie
|
6b7ea96c64
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
4586925aa3
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
716956f677
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
2951868eb5
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
ebbaf5494a
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
c8e0ee83b0
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
9fa7a6263a
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
b4c422b4be
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
541bec600c
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
001d3b3965
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
3e78f0431f
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
75edbd5bb9
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
ffaaf20313
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
a8baf58623
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
a0c6a060cf
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
a59d8b40a2
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
e8e87e7975
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
ce572ff677
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
40a04f3723
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
842e332caa
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
759d7db359
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
7982caa3ba
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
пре 3 месеци |
zhouyang.xie
|
39bf52bf4e
更换unsloth grpo的训练数据集并验证
|
пре 3 месеци |
zhouyang.xie
|
5b4e2ffb17
更换unsloth grpo的训练数据集并验证
|
пре 3 месеци |
zhouyang.xie
|
97fe68c387
更换unsloth grpo的训练数据集并验证
|
пре 3 месеци |
zhouyang.xie
|
efef4ac205
更换unsloth grpo的训练数据集并验证
|
пре 3 месеци |