修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 · 0f1c8812cb - Gogs

Quellcode durchsuchen

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie vor 4 Monaten

Ursprung

7409bac7d8

Commit

0f1c8812cb

1 geänderte Dateien mit 0 neuen und 0 gelöschten Zeilen

Geteilte Ansicht Diff-Statistik anzeigen

				
					Datei-Diff unterdrückt, da er zu groß ist
					
						+ 0
						
						- 0
					
data/processed/train.jsonl

			
				Einige Dateien werden nicht angezeigt, da zu viele Dateien in diesem Diff geändert wurden.