This website works better with JavaScript
Startseite
Erkunden
Hilfe
Registrieren
Anmelden
zhouyang.xie
/
unsloth_deepseek
Beobachten
1
Favorit hinzufügen
0
Fork
0
Dateien
Issues
0
Pull-Requests
0
Wiki
Quellcode durchsuchen
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
zhouyang.xie
vor 2 Monaten
Ursprung
7409bac7d8
Commit
0f1c8812cb
1 geänderte Dateien
mit
0 neuen
und
0 gelöschten
Zeilen
Geteilte Ansicht
Diff-Statistik anzeigen
0
0
data/processed/train.jsonl
Datei-Diff unterdrückt, da er zu groß ist
+ 0
- 0
data/processed/train.jsonl
Einige Dateien werden nicht angezeigt, da zu viele Dateien in diesem Diff geändert wurden.