瀏覽代碼

更换unsloth grpo的训练数据集并验证

zhouyang.xie 4 月之前
父節點
當前提交
39bf52bf4e
共有 1 個文件被更改,包括 1 次插入1 次删除
  1. 1 1
      src/train_model_grpo.py

+ 1 - 1
src/train_model_grpo.py

@@ -153,7 +153,7 @@ class ModelTrainer:
 
     def load_data(self, train_data_path):
         # 加载训练集和测试集
-        data = load_dataset("json", data_files={"train": train_data_path}, split="train")
+        train_dataset = load_dataset("json", data_files={"train": train_data_path}, split="train")
 
         # train_loader = torch.utils.data.DataLoader(
         #     train_dataset, batch_size=1, shuffle=True, pin_memory=True  # 启用 pin_memory  2025年3月7日未能验证通过