This website works better with JavaScript
ホーム
エクスプローラ
ヘルプ
登録
サインイン
zhouyang.xie
/
unsloth_deepseek
ウォッチ
1
スター
0
フォーク
0
ファイル
課題
0
プルリクエスト
0
Wiki
ツリー:
acebf42a2f
ブランチ
タグ
master
コミット履歴
検索
作者
SHA1
メッセージ
日付
zhouyang.xie
acebf42a2f
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 ヶ月 前
zhouyang.xie
7409bac7d8
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 ヶ月 前
zhouyang.xie
9ff6f0acd6
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 ヶ月 前
zhouyang.xie
dc546bc9b7
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
2 ヶ月 前