zhouyang.xie
|
2275fcf164
遵循面向对象思想重构train_model_grpo.py
|
3 月之前 |
zhouyang.xie
|
9fa7a6263a
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
3 月之前 |
zhouyang.xie
|
b4c422b4be
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
3 月之前 |
zhouyang.xie
|
ca5fe63b52
完善README.MD说明
|
3 月之前 |
zhouyang.xie
|
b777163795
2025-3-5 18:29 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序;
|
3 月之前 |
zhouyang.xie
|
e2a3b8ab23
2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序;
|
3 月之前 |
zhouyang.xie
|
c5fc011955
完善代码及说明
|
3 月之前 |
zhouyang.xie
|
7270ddb56d
Initialize commit
|
3 月之前 |