修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 · 0f1c8812cb - Gogs

Parcourir la source

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie il y a 4 mois

Parent

7409bac7d8

commit

0f1c8812cb

1 fichiers modifiés avec 0 ajouts et 0 suppressions

Vue séparée Afficher les stats Diff

				
					Fichier diff supprimé car celui-ci est trop grand
					
						+ 0
						
						- 0
					
data/processed/train.jsonl

			
				Certains fichiers n'ont pas été affichés car il y a eu trop de fichiers modifiés dans ce diff