deepseek-ai

deepseek-ai/DeepGEMM

DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核

6,839星标903复刻Cuda在 GitHub 上查看 →

上榜期间星标增长

04-18
6,530#5
04-20
6,839#8