zhouyang.xie
|
0f1c8812cb
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
3 months ago |
zhouyang.xie
|
12eacbadc0
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
|
3 months ago |
root
|
94f8ee853c
更新 风电机组数据集格式(还原至gsm8k数据集格式)
|
3 months ago |
zhouyang.xie
|
b17ab0381a
重新生成 风电机组故障诊断的数据集
|
3 months ago |
zhouyang.xie
|
18ec7c1cc4
重新生成 风电机组故障诊断的数据集
|
3 months ago |
zhouyang.xie
|
91bb641d42
遵循面向对象思想重构train_model_grpo_v1.1.py 去掉分布式及相应环境变量设置代码
|
3 months ago |
zhouyang.xie
|
97fe68c387
更换unsloth grpo的训练数据集并验证
|
3 months ago |
zhouyang.xie
|
e2a3b8ab23
2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序;
|
3 months ago |
zhouyang.xie
|
c5fc011955
完善代码及说明
|
3 months ago |