zhouyang.xie
|
ef6f70cbf7
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
acebf42a2f
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
0f1c8812cb
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
7409bac7d8
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
f8443b3682
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
12eacbadc0
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
9ff6f0acd6
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
dc546bc9b7
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
před 2 měsíci |
zhouyang.xie
|
73be517bb5
修改 风电机组数据集格式
|
před 2 měsíci |
zhouyang.xie
|
98ecc19bfb
修改 风电机组数据集格式
|
před 2 měsíci |
root
|
94f8ee853c
更新 风电机组数据集格式(还原至gsm8k数据集格式)
|
před 2 měsíci |
root
|
f8e2d2bfcd
更新 风电机组数据集格式(还原至gsm8k数据集格式)
|
před 2 měsíci |
zhouyang.xie
|
30a1a69274
修改 风电机组数据集格式
|
před 2 měsíci |
zhouyang.xie
|
948ec7eb5d
修改 风电机组数据集格式
|
před 2 měsíci |
zhouyang.xie
|
39ae535b0d
修改 风电机组数据集格式
|
před 2 měsíci |
zhouyang.xie
|
5a1c263040
修改 grpo v1.1.py源代码- correctness_reward_func函数
|
před 2 měsíci |
root
|
5e21073349
添加示例数据集- gsm8k 小学数学
|
před 2 měsíci |
zhouyang.xie
|
a13f9a7e87
重新生成 风电机组故障诊断的数据集
|
před 2 měsíci |
zhouyang.xie
|
2a0bb731cc
重新生成 风电机组故障诊断的数据集
|
před 2 měsíci |
zhouyang.xie
|
b17ab0381a
重新生成 风电机组故障诊断的数据集
|
před 2 měsíci |
zhouyang.xie
|
18ec7c1cc4
重新生成 风电机组故障诊断的数据集
|
před 2 měsíci |
zhouyang.xie
|
1021527859
完善README.MD - 增加 奖励函数的说明
|
před 2 měsíci |
zhouyang.xie
|
b704be1c79
完善README.MD - 增加 奖励函数的说明
|
před 2 měsíci |
zhouyang.xie
|
cfe49ef53e
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
před 2 měsíci |
zhouyang.xie
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
před 2 měsíci |
zhouyang.xie
|
dff6b0d9c7
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
před 2 měsíci |
zhouyang.xie
|
1bef66edba
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
před 2 měsíci |
zhouyang.xie
|
73a5634a5e
遵循面向对象思想重构train_model_grpo.py
|
před 2 měsíci |
zhouyang.xie
|
6401c68303
遵循面向对象思想重构train_model_grpo.py
|
před 2 měsíci |
zhouyang.xie
|
a96f63805a
遵循面向对象思想重构train_model_grpo.py
|
před 2 měsíci |