Movatterモバイル変換

Skip to content

#

cuda-kernels

Here are 299 public repositories matching this topic...

Language:All

Filter by language

All299 Cuda124 C++51 Python40 Jupyter Notebook24 C15 Rust7 C#4 HTML3 Go2 JavaScript2

Sort:Most stars

Sort options

Most stars Fewest stars Most forks Fewest forks Recently updated Least recently updated

LeetCUDA

xlite-dev /LeetCUDA

📚LeetCUDA: Modern CUDA Learn Notes with PyTorch for Beginners🐑, 200+ CUDA Kernels, Tensor Cores, HGEMM, FA-2 MMA.🎉

cuda cuda-kernels cuda-demo cuda-toolkit cuda-library cuda-kernel learn-cuda cuda-cpp hgemm flash-attention leet-cuda cuda-12

UpdatedFeb 13, 2026
Cuda

NVIDIA /cuda-samples

Samples for CUDA Developers which demonstrates features in CUDA Toolkit

cuda cuda-kernels cuda-driver-api cuda-opengl

UpdatedJan 6, 2026
C

InternLM /lmdeploy

LMDeploy is a toolkit for compressing, deploying, and serving LLMs.

llama cuda-kernels deepspeed llm fastertransformer llm-inference turbomind internlm llama2 codellama llama3

UpdatedFeb 13, 2026
Python

Rust-GPU /rust-cuda

Ecosystem of libraries and tools for writing and executing fast GPU code fully in Rust.

rust gpu cuda rust-lang gpgpu cuda-kernels gpu-programming cuda-programming

UpdatedFeb 16, 2026
Rust

NVIDIA /cccl

CUDA Core Compute Libraries

cpp hpc gpu modern-cpp parallel-computing cuda nvidia gpu-acceleration cuda-kernels gpu-computing parallel-algorithm parallel-programming nvidia-gpu gpu-programming cuda-library cpp-programming cuda-programming accelerated-computing cuda-cpp

UpdatedFeb 19, 2026
C++

chelsea0x3b /dfdx

Deep learning in Rust, with shape checked tensors and neural networks

rust machine-learning deep-neural-networks deep-learning neural-network gpu cuda autograd rust-lang gpu-acceleration cuda-kernels tensor gpu-computing backpropagation cudnn cuda-toolkit cuda-support autodiff autodifferentiation

UpdatedJul 23, 2024
Rust

chelsea0x3b /cudarc

Safe rust wrapper around CUDA toolkit

rust gpu cuda cublas gpu-acceleration cuda-kernels cudnn cuda-toolkit nccl curand cuda-programming nvrtc

UpdatedFeb 10, 2026
Rust

NVIDIA /nvbench

CUDA Kernel Benchmarking Library

benchmark performance gpu cuda nvidia cuda-kernels kernel-benchmark

UpdatedFeb 19, 2026
Cuda

deepreinforce-ai /CUDA-L2

CUDA-L2: Surpassing cuBLAS Performance for Matrix Multiplication through Reinforcement Learning

reinforcement-learning cublas nvidia matrix-multiplication cuda-kernels large-language-models

UpdatedJan 8, 2026
Cuda

kernel_tuner

KernelTuner /kernel_tuner

Kernel Tuner

python c testing machine-learning cplusplus gpu optimization opencl cuda autotuning software-development opencl-kernels kernel-tuner cuda-kernels gpu-computing auto-tuning

UpdatedFeb 17, 2026
Python

harrism /hemi

Simple utilities to enable code reuse and portability between CUDA C/C++ and standard C/C++.

c-plus-plus gpu cuda cuda-kernels cuda-device hemi

UpdatedApr 14, 2022
C++

jaredhoberock /stanford-cs193g-sp2010

This is an archive of materials produced for an introductory class on CUDA programming at Stanford University in 2010

cuda cuda-kernels gpu-programming cuda-programming

UpdatedJun 24, 2022
C++

HenryNdubuaku /cuda-tutorials

Comprehensive CUDA tutorials for Maths & ML with examples.

machine-learning cuda cuda-kernels maths cuda-programming

UpdatedJun 11, 2025
Cuda

deepakkumar1984 /Amplifier.NET

Amplifier allows .NET developers to easily run complex applications with intensive mathematical computation on Intel CPU/GPU, NVIDIA, AMD without writing any additional C kernel code. Write your function in .NET and Amplifier will take care of running it on your favorite hardware.

compiler opencl simd gpgpu opencl-kernels cuda-kernels gpgpu-computing gpgpu-sim

UpdatedDec 23, 2025
C#

alexzhang13 /flashattention2-custom-mask

Triton implementation of FlashAttention2 that adds Custom Masks.

deep-learning triton attention cuda-kernels attention-mechanism triton-lang flash-attention flash-attention-2

UpdatedAug 14, 2024
Python

PatWie /cuda-design-patterns

Some CUDA design patterns and a bit of template magic for CUDA

gpu cuda bazel cpp11 template-metaprogramming cuda-kernels cuda-device cuda-development cuda-utils

UpdatedJun 3, 2023
C++

tudelft /cuSNN

Spiking Neural Networks in C++ with strong GPU acceleration through CUDA

neural-network cuda spiking-neural-networks cuda-kernels

UpdatedJul 3, 2020
Cuda

m-a-n-i-f-e-s-t /power-attention

Attention Kernels for Symmetric Power Transformers

deep-learning cuda-kernels llms

UpdatedSep 25, 2025

wangsiping97 /FastGEMV

High-speed GEMV kernels, at most 2.7x speedup compared to pytorch baseline.

machine-learning optimization cuda cuda-kernels

UpdatedJul 13, 2024
Cuda

eyalroz /cuda-kat

CUDA kernel author's tools

patterns algorithms gpu constexpr modern-cpp cuda printf cpp11 utility-library cuda-kernels gpu-programming cuda-library elegant-coding cuda-programming utility-functions printf-functions

UpdatedApr 24, 2022
Cuda

Improve this page

Add a description, image, and links to thecuda-kernels topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with thecuda-kernels topic, visit your repo's landing page and select "manage topics."

[8]ページ先頭

©2009-2026 Movatter.jp