大语言模型微调与强化学习 🦥 以2倍速度训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3,节省70%显存
📊 项目信息
- 语言
- Python
- Stars
- ⭐ 56,682
- Forks
- 4,757
- 今日新增
- +1,262
- 排名
- #5
- 收录
- 总榜
- 趋势日期
- 2026年3月19日
- 最后推送
- 2026/3/19
🏷️ 标签
agentdeepseekdeepseek-r1fine-tuninggemmagemma3gpt-ossllamallama3llmllmsmistralopenaiqwenqwen3reinforcement-learningtext-to-speechttsunslothvoice-cloning


