This website works better with JavaScript
首頁
探索
說明
註冊
登入
zhouyang.xie
/
unsloth_deepseek
關注
1
讚好
0
複刻
0
檔案
問題管理
0
合併請求
0
Wiki
分支:
master
分支列表
標籤列表
master
提交歷史
查找
作者
SHA1
備註
提交日期
zhouyang.xie
3f8e53e024
换用github jwjohns/unsloth-GRPO-qwen2.5 验证GRPO训练模型
2 月之前
zhouyang.xie
e2a3b8ab23
2025-3-5 README.MD大模型选型评估,训练、微调所需计算资源评估;完善训练数据集生成、训练、推理源程序;
3 月之前
zhouyang.xie
c5fc011955
完善代码及说明
3 月之前