大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存
📊 项目信息
- 语言
- Python
- Stars
- ⭐ 65,875
- Forks
- 5,892
- 今日新增
- +102
- 排名
- #11
- 收录
- 语言榜
- 趋势日期
- 2026年6月5日
- 最后推送
- 2026/6/5
🏷️ 标签
agentdeepseekfine-tuninggemmagemma3gpt-ossllamallama3llmllmsmistralopenaiqwenreinforcement-learningself-hostedtext-to-speechttsuiunsloth


