deepseek-ai

deepseek-ai / DeepGEMM

#1
7,3081,001+7 todayCuda

DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核

📊 项目信息

语言
Cuda
Stars
7,308
Forks
1,001
今日新增
+7
排名
#1
收录
语言榜
趋势日期
2026年5月27日
最后推送
2026/5/13