فهرست منبع

换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型

zhouyang.xie 2 ماه پیش
والد
کامیت
2f61ec36fb
1فایلهای تغییر یافته به همراه1 افزوده شده و 0 حذف شده
  1. 1 0
      src/train_model_github_jwjohns.py

+ 1 - 0
src/train_model_github_jwjohns.py

@@ -5,6 +5,7 @@
 import re
 import torch
 import os
+import json
 from unsloth import FastLanguageModel, PatchFastRL, is_bfloat16_supported
 
 # Enable Unsloth's CLI training metrics visualization