deepseek-ai

deepseek-ai / DeepGEMM

#2
7,3301,019+6 todayCuda

DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核

📊 项目信息

语言
Cuda
Stars
7,330
Forks
1,019
今日新增
+6
排名
#2
收录
语言榜
趋势日期
2026年6月3日
最后推送
2026/6/2