修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 · 0f1c8812cb - Gogs

Bläddra i källkod

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 4 månader sedan

förälder

7409bac7d8

incheckning

0f1c8812cb

1 ändrade filer med 0 tillägg och 0 borttagningar

Delad Vy Visa Diff Statistik

				
					Filskillnaden har hållts tillbaka eftersom den är för stor
					
						+ 0
						
						- 0
					
data/processed/train.jsonl