há 9 meses atrás · 93c55c7c93
--- a/src/train_model_grpo_v1.py
+++ b/src/train_model_grpo_v1.py
@@ -90,7 +90,7 @@ class ModelTrainer:
 
															         )
														
 
															         torch.cuda.empty_cache()
														
 
															-
														
 
															+        print("self.config.learning_rate=",self.config.learning_rate)
														
 
															         training_args = GRPOConfig(
														
 
															             use_vllm=self.config.use_vllm,
														
 
															             learning_rate=self.config.learning_rate,