소스 검색

换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型

zhouyang.xie 2 달 전
부모
커밋
5710e9f30e
1개의 변경된 파일1개의 추가작업 그리고 1개의 파일을 삭제
  1. 1 1
      src/train_model_grpo_v1.2.py

+ 1 - 1
src/train_model_grpo_v1.2.py

@@ -87,7 +87,7 @@ class ModelTrainer:
                 data.append(json.loads(line))
         
         # 将列表转换为 HuggingFace Dataset 对象
-        data = Dataset.from_list(data)
+        train_dataset = Dataset.from_list(data)
 
         return train_dataset