This website works better with JavaScript
Головна сторінка
Огляд
Довідка
Реєстрація
Увійти
zhouyang.xie
/
unsloth_deepseek
Слідкувати
1
Зірка
0
Відгалуження
0
Файли
Проблеми
0
Запити на злиття
0
Wiki
Переглянути джерело
修改训练代码为train_model_grpo_v1.2.py 以解决训练输出未达预期问题
zhouyang.xie
2 місяців тому
батько
7409bac7d8
коміт
0f1c8812cb
1 змінених файлів
з
0 додано
та
0 видалено
Розділений вигляд
Показати статистику Diff
0
0
data/processed/train.jsonl
Різницю між файлами не показано, бо вона завелика
+ 0
- 0
data/processed/train.jsonl
Деякі файли не було показано, через те що забагато файлів було змінено