9 tháng trước cách đây · 93c55c7c93
--- a/src/train_model_grpo_v1.py
+++ b/src/train_model_grpo_v1.py
@@ -90,7 +90,7 @@ class ModelTrainer:
 
				         )
			
 
				 
			
 
				         torch.cuda.empty_cache()
			
 
				-
			
 
				+        print("self.config.learning_rate=",self.config.learning_rate)
			
 
				         training_args = GRPOConfig(
			
 
				             use_vllm=self.config.use_vllm,
			
 
				             learning_rate=self.config.learning_rate,