This website works better with JavaScript
首頁
探索
說明
註冊
登入
zhouyang.xie
/
unsloth_deepseek
關注
1
讚好
0
複刻
0
檔案
問題管理
0
合併請求
0
Wiki
瀏覽代碼
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
zhouyang.xie
2 月之前
父節點
7409bac7d8
當前提交
0f1c8812cb
共有
1 個文件被更改
,包括
0 次插入
和
0 次删除
分割檢視
顯示文件統計
0
0
data/processed/train.jsonl
文件差異過大導致無法顯示
+ 0
- 0
data/processed/train.jsonl
部分文件因文件數量過多而無法顯示