Cuda 热门项目

GitHub Cuda 热门开源项目 · 近 7 天数据

karpathy
karpathy /

llm.c

#7

基于纯C/CUDA的简易大语言模型训练

30,1073,623+9
Cuda
alibaba
alibaba /

rtp-llm

#1

RTP-LLM:阿里巴巴面向多样化应用的高性能大语言模型推理引擎。

1,178204+8
Cuda
gptinferencellamallmllm-serving
deepseek-ai
deepseek-ai /

DeepGEMM

#2

DeepGEMM:具备细粒度缩放功能的精简高效FP8通用矩阵乘内核

7,3301,019+6
Cuda
NVIDIA
NVIDIA /

cuopt

#14

GPU加速决策优化

918184+5
Cuda
cudagpulinear-programmingoptimization
thu-ml
thu-ml /

SageAttention

#6

量化注意力机制相比FlashAttention和xformers实现了2-5倍和3-11倍的速度提升,且在语言、图像和视频模型上保持端到端指标无损。

3,407425+4
Cuda
attentioncudaefficient-attentioninference-accelerationllm
deepseek-ai
deepseek-ai /

DeepEP

#4

DeepEP:高效的专家并行通信库

9,6941,276+4
Cuda
mirage-project
mirage-project /

mirage

#15

Mirage持久化内核:将大语言模型编译为单一巨型内核

2,289214+2
Cuda
brucefan1983
brucefan1983 /

GPUMD

#3

图形处理器分子动力学

782186+2
Cuda
cudagpugpumdheat-transporthigh-performance-computing
NVlabs
NVlabs /

instant-ngp

#13

即时神经图形原语:极速神经辐射场(NeRF)及其他技术

17,4142,065+1
Cuda
3d-reconstructioncomputer-graphicscomputer-visioncudafunction-approximation
HenryHuYu
HenryHuYu /

DiffPhysDrone

#10

发表于《自然·机器智能》!首个基于可微分物理训练的实体机器人(四旋翼飞行器)。

55982+1
Cuda
droneend-to-endreinforcement-learningrobotics
Dao-AILab
Dao-AILab /

causal-conv1d

#9

支持PyTorch接口的CUDA因果深度wise一维卷积实现

893188+1
Cuda
NVIDIA
NVIDIA /

CUDALibrarySamples

#5

CUDA库示例集

2,423459+1
Cuda
cudacudsscufftcurandcusolver
HazyResearch
HazyResearch /

ThunderKittens

#12

高性能核函数切片原语

3,405290
Cuda
rapidsai
rapidsai /

cugraph

#11

cuGraph - RAPIDS 图分析库

2,187357
Cuda
complex-networkscudagpugraphgraph-algorithms
NVIDIA
NVIDIA /

nccl-tests

#8

NCCL测试套件

1,539375
Cuda

其他语言