修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 · 0f1c8812cb - Gogs

Explorar o código

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie hai 4 meses

pai

7409bac7d8

achega

0f1c8812cb

Modificáronse 1 ficheiros con 0 adicións e 0 borrados

Dividir vista Mostrar estatísticas de Diff

				
					A diferenza do arquivo foi suprimida porque é demasiado grande
					
						+ 0
						
						- 0
					
data/processed/train.jsonl

			
				Algúns arquivos non se mostraron porque demasiados arquivos cambiaron neste cambio