deepseek-ai/DeepGEMMCuda6.9k
GitHubで見る →
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
言語
Cuda
ライセンス
MIT
最終更新
2026-04-17
スター数
6,914
フォーク数
910
Issue数
68