deepseek-ai

deepseek-ai / DeepGEMM

#2
7,3141,007+3 todayCuda

DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核

📊 项目信息

语言
Cuda
Stars
7,314
Forks
1,007
今日新增
+3
排名
#2
收录
语言榜
趋势日期
2026年5月29日
最后推送
2026/5/29