zhouyang.xie
|
30a1a69274
修改 风电机组数据集格式
|
3 months ago |
zhouyang.xie
|
948ec7eb5d
修改 风电机组数据集格式
|
3 months ago |
zhouyang.xie
|
39ae535b0d
修改 风电机组数据集格式
|
3 months ago |
zhouyang.xie
|
5a1c263040
修改 grpo v1.1.py源代码- correctness_reward_func函数
|
3 months ago |
root
|
5e21073349
添加示例数据集- gsm8k 小学数学
|
3 months ago |
zhouyang.xie
|
a13f9a7e87
重新生成 风电机组故障诊断的数据集
|
3 months ago |
zhouyang.xie
|
2a0bb731cc
重新生成 风电机组故障诊断的数据集
|
3 months ago |
zhouyang.xie
|
b17ab0381a
重新生成 风电机组故障诊断的数据集
|
3 months ago |
zhouyang.xie
|
18ec7c1cc4
重新生成 风电机组故障诊断的数据集
|
3 months ago |
zhouyang.xie
|
1021527859
完善README.MD - 增加 奖励函数的说明
|
3 months ago |
zhouyang.xie
|
b704be1c79
完善README.MD - 增加 奖励函数的说明
|
3 months ago |
zhouyang.xie
|
cfe49ef53e
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 months ago |
zhouyang.xie
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 months ago |
zhouyang.xie
|
dff6b0d9c7
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 months ago |
zhouyang.xie
|
1bef66edba
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 months ago |
zhouyang.xie
|
73a5634a5e
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
6401c68303
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
a96f63805a
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
77168b22a2
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
c7b5cc14c5
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
6529570532
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
71cb307569
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
a656b45e84
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
4bb9924e00
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
d97b2ed3a6
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
cd5cc43486
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
95988ed459
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
8f30a3f1e1
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
3634ab78f0
遵循面向对象思想重构train_model_grpo.py
|
3 months ago |
zhouyang.xie
|
93c55c7c93
修改train_model_grpo.py文件-开启vLLM 观察能否解决损失率值0并且无变化问题
|
3 months ago |