Explorar o código

换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型

zhouyang.xie hai 2 meses
pai
achega
5710e9f30e
Modificáronse 1 ficheiros con 1 adicións e 1 borrados
  1. 1 1
      src/train_model_grpo_v1.2.py

+ 1 - 1
src/train_model_grpo_v1.2.py

@@ -87,7 +87,7 @@ class ModelTrainer:
                 data.append(json.loads(line))
         
         # 将列表转换为 HuggingFace Dataset 对象
-        data = Dataset.from_list(data)
+        train_dataset = Dataset.from_list(data)
 
         return train_dataset