修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题 · 0f1c8812cb - Gogs

ソースを参照

修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题

zhouyang.xie 4 ヶ月前

親

7409bac7d8

コミット

0f1c8812cb

1 ファイル変更、0 行追加、0 行削除

分割表示差分情報を表示

				
					ファイルの差分が大きいため隠しています
					
						+ 0
						
						- 0
					
data/processed/train.jsonl

			
				この差分においてかなりの量のファイルが変更されているため、一部のファイルを表示していません