修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 · 0f1c8812cb - Gogs

Selaa lähdekoodia

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 4 kuukautta sitten

vanhempi

7409bac7d8

commit

0f1c8812cb

1 muutettua tiedostoa jossa 0 lisäystä ja 0 poistoa

Jaettu näkymä Näytä diff tilastot

				
					Tiedoston diff-näkymää rajattu, sillä se on liian suuri
					
						+ 0
						
						- 0
					
data/processed/train.jsonl

			
				Kaikkia tiedostoja ei voida näyttää, sillä liian monta tiedostoa muuttui tässä diffissä