dsv3.cuda

Fast inference for DeepSeek-V3 LLMs written in CUDA.

Quick Start

Requirements

Steps

Install Weights

# Weights is a symbolic link so you will have to change it
cd weights

# Clone weights from huggingface
git clone https://huggingface.co/deepseek-ai/DeepSeek-V3

Build Inference Engine

bazel build

Run

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
kernels		kernels
model		model
.gitignore		.gitignore
BUILD		BUILD
LICENSE		LICENSE
MODULE.bazel		MODULE.bazel
MODULE.bazel.lock		MODULE.bazel.lock
README.md		README.md
interactive_a40x1.sh		interactive_a40x1.sh
interactive_h200x1.sh		interactive_h200x1.sh
next_token_generation.cpp		next_token_generation.cpp
weights		weights

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

dsv3.cuda

Quick Start

Requirements

Steps

Resources

About

Uh oh!

Releases

Packages

Languages

License

andyluo03/dsv3.cuda

Folders and files

Latest commit

History

Repository files navigation

dsv3.cuda

Quick Start

Requirements

Steps

Resources

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages