9 달 전 · 7409bac7d8
--- a/src/train_model_grpo_v1.2.py
+++ b/src/train_model_grpo_v1.2.py
@@ -244,6 +244,7 @@ class ModelTrainer:
 
				         :return: 提取的答案
			
 
				         """
			
 
				         try:
			
 
				+            print("text -> \n",text)
			
 
				             if "<answer>" in text and "</answer>" in text:
			
 
				                 answer = text.split("<answer>")[-1]
			
 
				                 answer = answer.split("</answer>")[0]