Browse Source

换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型

zhouyang.xie 4 tháng trước cách đây
mục cha
commit
5710e9f30e
1 tập tin đã thay đổi với 1 bổ sung1 xóa
  1. 1 1
      src/train_model_grpo_v1.2.py

+ 1 - 1
src/train_model_grpo_v1.2.py

@@ -87,7 +87,7 @@ class ModelTrainer:
                 data.append(json.loads(line))
         
         # 将列表转换为 HuggingFace Dataset 对象
-        data = Dataset.from_list(data)
+        train_dataset = Dataset.from_list(data)
 
         return train_dataset