Для чистой Markdown-версии этой страницы добавьте .md к этому URL. Полный индекс документации см. в https://docs.nvidia.com/dynamo/llms.txt. Полное содержимое, включая справочник API и примеры SDK, см. в https://docs.nvidia.com/dynamo/llms-full.txt.

Матрица поддержки

См. также: Артефакты релиза для образов контейнеров, wheels, Helm charts и crates | Матрица функций для поддержки функций backend'ов

Краткий обзор

Последний стабильный релиз: v1.2.0 -- SGLang 0.5.11 (NIXL 1.0.1) | TensorRT-LLM 1.3.0rc14 (NIXL 0.10.1) | vLLM 0.20.1 (NIXL 0.10.1)

Экспериментальный релиз: v1.2.0-deepseek-v4-dev.3 (DeepSeek-V4-Flash / V4-Pro на Blackwell, только контейнеры vLLM + SGLang) -- vLLM 0.20.1 | upstream-предпросмотр SGLang deepseek-v4-blackwell | NIXL 0.10.1

Требование	Поддержка
GPU	NVIDIA Ampere, Ada Lovelace, Hopper, Blackwell
OS	Ubuntu 22.04, Ubuntu 24.04, CentOS Stream 9 (экспериментально)
Arch	x86_64, ARM64 (для ARM64 требуется Ubuntu 24.04)
CUDA 12	Образы контейнеров для SGLang и vLLM (CUDA 12.9)
CUDA 13	Образы контейнеров для TensorRT-LLM (CUDA 13.1), SGLang и vLLM (CUDA 13.0)

Зависимости backend'ов

Требования к драйверам различаются в зависимости от backend'а — см. ниже CUDA и требования к драйверам.

В следующей таблице показаны версии backend-фреймворков, входящие в каждый релиз Dynamo:

Dynamo	SGLang	TensorRT-LLM	vLLM	NIXL
main (ToT)	`0.5.11`	`1.3.0rc16`	`0.21.0`	`0.10.1` (TRT-LLM); `1.1.0` (vLLM); `1.0.1` (SGLang)
v1.2.0	`0.5.11`	`1.3.0rc14`	`0.20.1`	`0.10.1` (TRT-LLM, vLLM); `1.0.1` (SGLang)
v1.2.0-deepseek-v4-dev.3 (experimental, partial)	upstream DSv4 preview	—	`0.20.1`	`0.10.1`
v1.2.0-deepseek-v4-dev.2 (experimental, partial)	upstream DSv4 preview	—	`0.20.0`	`0.10.1`
v1.1.1	`0.5.10.post1`	`1.3.0rc11`	`0.19.0`	`0.10.1` (TRT-LLM, vLLM); `1.0.1` (SGLang)
v1.1.0	`0.5.10.post1`	`1.3.0rc11`	`0.19.0`	`0.10.1` (TRT-LLM, vLLM); `1.0.1` (SGLang)
v1.1.0-dev.3 (experimental, partial)	`0.5.10.post1`	`1.3.0rc11`	`0.19.0`	`0.10.1`
v1.1.0-dev.2 (experimental, partial)	`0.5.9`	`1.3.0rc9`	`0.19.0`	`0.10.1`
v1.1.0-dev.1 (experimental)	`0.5.9`	`1.3.0rc5.post1`	`0.17.1`	`0.10.1`
v1.0.2	`0.5.9`	`1.3.0rc5.post1`	`0.16.0`	`0.10.1`
v1.0.1	`0.5.9`	`1.3.0rc5.post1`	`0.16.0`	`0.10.1`
v1.0.0	`0.5.9`	`1.3.0rc5.post1`	`0.16.0`	`0.10.1`
v0.9.1	`0.5.8`	`1.3.0rc3`	`0.14.1`	`0.9.0`
v0.9.0	`0.5.8`	`1.3.0rc1`	`0.14.1`	`0.9.0`
v0.8.1.post3	`0.5.6.post2`	`1.2.0rc6.post3`	`0.12.0`	`0.8.0`
v0.8.1.post2	`0.5.6.post2`	`1.2.0rc6.post2`	`0.12.0`	`0.8.0`
v0.8.1.post1	`0.5.6.post2`	`1.2.0rc6.post1`	`0.12.0`	`0.8.0`
v0.8.1	`0.5.6.post2`	`1.2.0rc6.post1`	`0.12.0`	`0.8.0`
v0.8.0	`0.5.6.post2`	`1.2.0rc6.post1`	`0.12.0`	`0.8.0`
v0.7.1	`0.5.4.post3`	`1.2.0rc3`	`0.11.0`	`0.8.0`
v0.7.0.post1	`0.5.4.post3`	`1.2.0rc3`	`0.11.0`	`0.8.0`
v0.7.0	`0.5.4.post3`	`1.2.0rc2`	`0.11.0`	`0.8.0`
v0.6.1.post1	`0.5.3.post2`	`1.1.0rc5`	`0.11.0`	`0.6.0`
v0.6.1	`0.5.3.post2`	`1.1.0rc5`	`0.11.0`	`0.6.0`
v0.6.0	`0.5.3.post2`	`1.1.0rc5`	`0.11.0`	`0.6.0`

Для v1.1.0-dev.2, v1.1.0-dev.3, v1.2.0-deepseek-v4-dev.2 и v1.2.0-deepseek-v4-dev.3 ячейки выше соответствуют container/context.yaml в соответствующей ветке релиза (pins, использованные для сборки образов). Эти строки — частичные релизы: не для каждого backend'а опубликован контейнер Dynamo runtime для этого тега. Что именно было выпущено, см. в Pre-Release Artifacts. Контейнеры SGLang для v1.2.0-deepseek-v4-dev.2 и v1.2.0-deepseek-v4-dev.3 собраны на основе upstream preview-образа lmsysorg/sglang:deepseek-v4-blackwell, а не tagged-релиза SGLang; TensorRT-LLM в эти dev-релизы не входит.

Обозначения версий

1.3.0 (main / ToT) отражает текущую ветку разработки.
Релизы, помеченные (experimental, partial), являются предварительными: таблица показывает pins сборки ветки, и для этого dev-тега еще может не быть NGC-образов для всех backend'ов.
Релизы, помеченные (in progress) или (planned), показывают целевые версии, которые могут измениться до финального выпуска.

Совместимость версий

Перечисленные версии backend'ов — единственные версии, протестированные и поддерживаемые для каждого релиза.
TensorRT-LLM не поддерживает Python 3.11; установка wheel ai-dynamo[trtllm] завершится ошибкой на Python 3.11.

Требования к CUDA и драйверам

Образы контейнеров Dynamo включают библиотеки CUDA toolkit. На хостовой машине должен быть установлен совместимый драйвер NVIDIA GPU.

Версия Dynamo	Backend	CUDA Toolkit	Минимальный драйвер	Примечания
1.2.0	SGLang	12.9	575.xx+
		13.0	580.xx+
	TensorRT-LLM	13.1	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+
1.1.1	SGLang	12.9	575.xx+
		13.0	580.xx+
	TensorRT-LLM	13.1	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+
1.1.0	SGLang	12.9	575.xx+
		13.0	580.xx+
	TensorRT-LLM	13.1	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+
1.0.2	SGLang	12.9	575.xx+
		13.0	580.xx+
	TensorRT-LLM	13.1	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+
1.0.1	SGLang	12.9	575.xx+
		13.0	580.xx+
	TensorRT-LLM	13.1	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+
1.0.0	SGLang	12.9	575.xx+
		13.0	580.xx+
	TensorRT-LLM	13.1	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+
0.9.1	SGLang	12.9	575.xx+
	TensorRT-LLM	13.0	580.xx+
	vLLM	12.9	575.xx+
0.9.0	SGLang	12.9	575.xx+
	TensorRT-LLM	13.0	580.xx+
	vLLM	12.9	575.xx+
0.8.1	SGLang	12.9	575.xx+
		13.0	580.xx+	Экспериментально
	TensorRT-LLM	13.0	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+	Экспериментально
0.8.0	SGLang	12.9	575.xx+
		13.0	580.xx+	Экспериментально
	TensorRT-LLM	13.0	580.xx+
	vLLM	12.9	575.xx+
		13.0	580.xx+	Экспериментально
0.7.1	SGLang	12.8	570.xx+
	TensorRT-LLM	13.0	580.xx+
	vLLM	12.9	575.xx+
0.7.0	SGLang	12.9	575.xx+
	TensorRT-LLM	13.0	580.xx+
	vLLM	12.8	570.xx+

Patch-версии (например, v0.8.1.post1, v0.7.0.post1) имеют ту же поддержку CUDA, что и базовая версия.

Экспериментальные образы v1.1.0-dev.* следуют той же матрице CUDA, что и v1.0.2. Контейнер vLLM для v1.2.0-deepseek-v4-dev.3 является multi-arch для CUDA 13.0; контейнеры SGLang разделены по архитектурам (CUDA 12.9 на amd64, CUDA 13.0 на arm64).

Экспериментальные образы CUDA 13 опубликованы не для всех версий. Наличие см. в Release Artifacts.

Подробные версии артефактов и ссылки NGC, включая container images, Python wheels, Helm charts и Rust crates, см. на странице Release Artifacts.

Ресурсы по совместимости CUDA

Подробную информацию о совместимости драйверов CUDA, forward compatibility и устранении неполадок см. здесь:

Для расширенной совместимости драйверов сверх минимальных версий, перечисленных выше, рассмотрите использование пакетов cuda-compat на хосте. Подробности см. в Forward Compatibility.

Совместимость оборудования

Архитектура CPU	Статус
x86_64	Поддерживается
ARM64	Поддерживается

Dynamo предоставляет multi-arch container images, поддерживающие архитектуры AMD64 (x86_64) и ARM64. Доступные образы см. в Release Artifacts.

Совместимость GPU

Если вы используете GPU, поддерживаются следующие модели и архитектуры:

GPU Architecture	Status
NVIDIA Blackwell Architecture	Поддерживается
NVIDIA Hopper Architecture	Поддерживается
NVIDIA Ada Lovelace Architecture	Поддерживается
NVIDIA Ampere Architecture	Поддерживается

Совместимость архитектуры платформы

Dynamo совместим со следующими платформами:

Operating System	Version	Architecture	Status
Ubuntu	22.04	x86_64	Поддерживается
Ubuntu	24.04	x86_64	Поддерживается
Ubuntu	24.04	ARM64	Поддерживается
CentOS Stream	9	x86_64	Экспериментально

Wheels собираются в окружении, совместимом с manylinux_2_28, и проверяются на CentOS Stream 9 и Ubuntu (22.04, 24.04). Совместимость с другими дистрибутивами Linux ожидается, но официально не подтверждена.

Совместимость с облачными провайдерами

AWS

Host Operating System	Version	Architecture	Status
Amazon Linux	2023	x86_64	Поддерживается

Ограничение AL2023 для TensorRT-LLM: Известна проблема с TensorRT-LLM при локальном запуске контейнера AL2023 с docker run --network host ... из-за ошибки в mpi4py. Чтобы обойти ее, замените флаг --network host на более точную сетевую конфигурацию, пробрасывая только необходимые порты (например, 4222 для nats, 2379/2380 для etcd, 8000 для frontend).

Поддержка сборки

Подробности по артефактам для конкретных версий, команды установки и историю релизов см. в Release Artifacts.

Dynamo сейчас предоставляет поддержку сборки следующими способами:

Wheels: Мы распространяем Python wheels для Dynamo и KV Block Manager:
- ai-dynamo
- ai-dynamo-runtime
- kvbm как самостоятельную реализацию.
Dynamo Container Images: Мы распространяем multi-arch образы (совместимые с x86 и ARM64) на NGC:
- Dynamo Frontend (новое в v0.8.0)
- SGLang Runtime
- SGLang Runtime (CUDA 13)
- TensorRT-LLM Runtime
- TensorRT-LLM Runtime (EFA) (новое в v1.0.0, экспериментально, только AMD64)
- vLLM Runtime
- vLLM Runtime (CUDA 13)
- vLLM Runtime (EFA) (новое в v1.0.0, экспериментально, только AMD64)
- Kubernetes Operator
- Snapshot Agent (новое в v1.0.0, предварительная версия)
Helm Charts: NGC размещает Helm charts для Kubernetes-развертываний Dynamo:
- Dynamo Platform (теперь включает CRD)
- Snapshot (новое в v1.0.0, предварительная версия)
- Dynamo CRDs (устарело в v1.0.0, CRD управляются Operator)
- Dynamo Graph (устарело в v0.9.0)
Rust Crates:
- dynamo-runtime
- dynamo-llm
- dynamo-protocols
- dynamo-parsers
- dynamo-config (New in v0.8.0)
- dynamo-memory (New in v0.8.0)
- dynamo-tokens (New in v0.9.0)
- dynamo-mocker (New in v1.0.0)
- dynamo-kv-router (New in v1.0.0)

После того как вы подтвердили совместимость платформы и архитектуры, можно установить Dynamo, следуя Быстрому старту на локальной машине в README.

Краткий обзор​

Зависимости backend'ов​

Обозначения версий​

Совместимость версий​

Требования к CUDA и драйверам​

Ресурсы по совместимости CUDA​

Совместимость оборудования​

Совместимость GPU​

Совместимость архитектуры платформы​

Совместимость с облачными провайдерами​

AWS​

Поддержка сборки​