deepseek-ai

deepseek-ai / DeepGEMM

#2
7,3171,011+2 todayCuda

DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核

📊 项目信息

语言
Cuda
Stars
7,317
Forks
1,011
今日新增
+2
排名
#2
收录
语言榜
趋势日期
2026年5月31日
最后推送
2026/5/29