This website works better with JavaScript
ホーム
エクスプローラ
ヘルプ
登録
サインイン
zhouyang.xie
/
unsloth_deepseek
ウォッチ
1
スター
0
フォーク
0
ファイル
課題
0
プルリクエスト
0
Wiki
ソースを参照
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
zhouyang.xie
2 ヶ月 前
親
7409bac7d8
コミット
0f1c8812cb
1 ファイル変更
、
0 行追加
、
0 行削除
分割表示
差分情報を表示
0
0
data/processed/train.jsonl
ファイルの差分が大きいため隠しています
+ 0
- 0
data/processed/train.jsonl
この差分においてかなりの量のファイルが変更されているため、一部のファイルを表示していません