修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 · 0f1c8812cb - Gogs

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 4 月之前

父节点

7409bac7d8

当前提交

0f1c8812cb

共有 1 个文件被更改，包括 0 次插入 和 0 次删除

分列视图显示文件统计

				
					文件差异内容过多而无法显示
					
						+ 0
						
						- 0
					
data/processed/train.jsonl