Для чистой Markdown-версии этой страницы добавьте
.mdк этому URL. Полный индекс документации см. в https://docs.nvidia.com/dynamo/llms.txt. Полное содержимое, включая справочник API и примеры SDK, см. в https://docs.nvidia.com/dynamo/llms-full.txt.
Матрица поддержки
См. также: Артефакты релиза для образов контейнеров, wheels, Helm charts и crates | Матрица функций для поддержки функций backend'ов
Краткий обзор
Последний стабильный релиз: v1.2.0 -- SGLang 0.5.11 (NIXL 1.0.1) | TensorRT-LLM 1.3.0rc14 (NIXL 0.10.1) | vLLM 0.20.1 (NIXL 0.10.1)
Экспериментальный релиз: v1.2.0-deepseek-v4-dev.3 (DeepSeek-V4-Flash / V4-Pro на Blackwell, только контейнеры vLLM + SGLang) -- vLLM 0.20.1 | upstream-предпросмотр SGLang deepseek-v4-blackwell | NIXL 0.10.1
| Требование | Поддержка |
|---|---|
| GPU | NVIDIA Ampere, Ada Lovelace, Hopper, Blackwell |
| OS | Ubuntu 22.04, Ubuntu 24.04, CentOS Stream 9 (экспериментально) |
| Arch | x86_64, ARM64 (для ARM64 требуется Ubuntu 24.04) |
| CUDA 12 | Образы контейнеров для SGLang и vLLM (CUDA 12.9) |
| CUDA 13 | Образы контейнеров для TensorRT-LLM (CUDA 13.1), SGLang и vLLM (CUDA 13.0) |
На этой странице: Зависимости backend'ов | CUDA и драйверы | Оборудование | Платформа | Облако | Поддержка сборки
Зависимости backend'ов
Требования к драйверам различаются в зависимости от backend'а — см. ниже CUDA и требования к драйверам.
В следующей таблице показаны версии backend-фреймворков, входящие в каждый релиз Dynamo:
| Dynamo | SGLang | TensorRT-LLM | vLLM | NIXL |
|---|---|---|---|---|
| main (ToT) | 0.5.11 | 1.3.0rc16 | 0.21.0 | 0.10.1 (TRT-LLM); 1.1.0 (vLLM); 1.0.1 (SGLang) |
| v1.2.0 | 0.5.11 | 1.3.0rc14 | 0.20.1 | 0.10.1 (TRT-LLM, vLLM); 1.0.1 (SGLang) |
| v1.2.0-deepseek-v4-dev.3 (experimental, partial) | upstream DSv4 preview | — | 0.20.1 | 0.10.1 |
| v1.2.0-deepseek-v4-dev.2 (experimental, partial) | upstream DSv4 preview | — | 0.20.0 | 0.10.1 |
| v1.1.1 | 0.5.10.post1 | 1.3.0rc11 | 0.19.0 | 0.10.1 (TRT-LLM, vLLM); 1.0.1 (SGLang) |
| v1.1.0 | 0.5.10.post1 | 1.3.0rc11 | 0.19.0 | 0.10.1 (TRT-LLM, vLLM); 1.0.1 (SGLang) |
| v1.1.0-dev.3 (experimental, partial) | 0.5.10.post1 | 1.3.0rc11 | 0.19.0 | 0.10.1 |
| v1.1.0-dev.2 (experimental, partial) | 0.5.9 | 1.3.0rc9 | 0.19.0 | 0.10.1 |
| v1.1.0-dev.1 (experimental) | 0.5.9 | 1.3.0rc5.post1 | 0.17.1 | 0.10.1 |
| v1.0.2 | 0.5.9 | 1.3.0rc5.post1 | 0.16.0 | 0.10.1 |
| v1.0.1 | 0.5.9 | 1.3.0rc5.post1 | 0.16.0 | 0.10.1 |
| v1.0.0 | 0.5.9 | 1.3.0rc5.post1 | 0.16.0 | 0.10.1 |
| v0.9.1 | 0.5.8 | 1.3.0rc3 | 0.14.1 | 0.9.0 |
| v0.9.0 | 0.5.8 | 1.3.0rc1 | 0.14.1 | 0.9.0 |
| v0.8.1.post3 | 0.5.6.post2 | 1.2.0rc6.post3 | 0.12.0 | 0.8.0 |
| v0.8.1.post2 | 0.5.6.post2 | 1.2.0rc6.post2 | 0.12.0 | 0.8.0 |
| v0.8.1.post1 | 0.5.6.post2 | 1.2.0rc6.post1 | 0.12.0 | 0.8.0 |
| v0.8.1 | 0.5.6.post2 | 1.2.0rc6.post1 | 0.12.0 | 0.8.0 |
| v0.8.0 | 0.5.6.post2 | 1.2.0rc6.post1 | 0.12.0 | 0.8.0 |
| v0.7.1 | 0.5.4.post3 | 1.2.0rc3 | 0.11.0 | 0.8.0 |
| v0.7.0.post1 | 0.5.4.post3 | 1.2.0rc3 | 0.11.0 | 0.8.0 |
| v0.7.0 | 0.5.4.post3 | 1.2.0rc2 | 0.11.0 | 0.8.0 |
| v0.6.1.post1 | 0.5.3.post2 | 1.1.0rc5 | 0.11.0 | 0.6.0 |
| v0.6.1 | 0.5.3.post2 | 1.1.0rc5 | 0.11.0 | 0.6.0 |
| v0.6.0 | 0.5.3.post2 | 1.1.0rc5 | 0.11.0 | 0.6.0 |
Для v1.1.0-dev.2, v1.1.0-dev.3, v1.2.0-deepseek-v4-dev.2 и v1.2.0-deepseek-v4-dev.3 ячейки выше соответствуют container/context.yaml в соответствующей ветке релиза (pins, использованные для сборки образов). Эти строки — частичные релизы: не для каждого backend'а опубликован контейнер Dynamo runtime для этого тега. Что именно было выпущено, см. в Pre-Release Artifacts. Контейнеры SGLang для v1.2.0-deepseek-v4-dev.2 и v1.2.0-deepseek-v4-dev.3 собраны на основе upstream preview-образа lmsysorg/sglang:deepseek-v4-blackwell, а не tagged-релиза SGLang; TensorRT-LLM в эти dev-релизы не входит.
Обозначения версий
- 1.3.0 (main / ToT) отражает текущую ветку разработки.
- Релизы, помеченные (experimental, partial), являются предварительными: таблица показывает pins сборки ветки, и для этого dev-тега еще может не быть NGC-образов для всех backend'ов.
- Релизы, помеченные (in progress) или (planned), показывают целевые версии, которые могут измениться до финального выпуска.
Совместимость версий
- Перечисленные версии backend'ов — единственные версии, протестированные и поддерживаемые для каждого релиза.
- TensorRT-LLM не поддерживает Python 3.11; установка wheel
ai-dynamo[trtllm]завершится ошибкой на Python 3.11.
Требования к CUDA и драйверам
Образы контейнеров Dynamo включают библиотеки CUDA toolkit. На хостовой машине должен быть установлен совместимый драйвер NVIDIA GPU.
| Версия Dynamo | Backend | CUDA Toolkit | Минимальный драйвер | Примечания |
|---|---|---|---|---|
| 1.2.0 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | |||
| TensorRT-LLM | 13.1 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | |||
| 1.1.1 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | |||
| TensorRT-LLM | 13.1 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | |||
| 1.1.0 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | |||
| TensorRT-LLM | 13.1 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | |||
| 1.0.2 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | |||
| TensorRT-LLM | 13.1 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | |||
| 1.0.1 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | |||
| TensorRT-LLM | 13.1 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | |||
| 1.0.0 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | |||
| TensorRT-LLM | 13.1 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | |||
| 0.9.1 | SGLang | 12.9 | 575.xx+ | |
| TensorRT-LLM | 13.0 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 0.9.0 | SGLang | 12.9 | 575.xx+ | |
| TensorRT-LLM | 13.0 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 0.8.1 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | Экспериментально | ||
| TensorRT-LLM | 13.0 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | Экспериментально | ||
| 0.8.0 | SGLang | 12.9 | 575.xx+ | |
| 13.0 | 580.xx+ | Экспериментально | ||
| TensorRT-LLM | 13.0 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 13.0 | 580.xx+ | Экспериментально | ||
| 0.7.1 | SGLang | 12.8 | 570.xx+ | |
| TensorRT-LLM | 13.0 | 580.xx+ | ||
| vLLM | 12.9 | 575.xx+ | ||
| 0.7.0 | SGLang | 12.9 | 575.xx+ | |
| TensorRT-LLM | 13.0 | 580.xx+ | ||
| vLLM | 12.8 | 570.xx+ |
Patch-версии (например, v0.8.1.post1, v0.7.0.post1) имеют ту же поддержку CUDA, что и базовая версия.
Экспериментальные образы v1.1.0-dev.* следуют той же матрице CUDA, что и v1.0.2. Контейнер vLLM для v1.2.0-deepseek-v4-dev.3 является multi-arch для CUDA 13.0; контейнеры SGLang разделены по архитектурам (CUDA 12.9 на amd64, CUDA 13.0 на arm64).
Экспериментальные образы CUDA 13 опубликованы не для всех версий. Наличие см. в Release Artifacts.
Подробные версии артефактов и ссылки NGC, включая container images, Python wheels, Helm charts и Rust crates, см. на странице Release Artifacts.
Ресурсы по совместимости CUDA
Подробную информацию о совместимости драйверов CUDA, forward compatibility и устранении неполадок см. здесь:
- CUDA Compatibility Overview
- Why CUDA Compatibility
- Minor Version Compatibility
- Forward Compatibility
- FAQ
Для расширенной совместимости драйверов сверх минимальных версий, перечисленных выше, рассмотрите использование пакетов cuda-compat на хосте. Подробности см. в Forward Compatibility.
Совместимость оборудования
| Архитектура CPU | Статус |
|---|---|
| x86_64 | Поддерживается |
| ARM64 | Поддерживается |
Dynamo предоставляет multi-arch container images, поддерживающие архитектуры AMD64 (x86_64) и ARM64. Доступные образы см. в Release Artifacts.
Совместимость GPU
Если вы используете GPU, поддерживаются следующие модели и архитектуры:
| GPU Architecture | Status |
|---|---|
| NVIDIA Blackwell Architecture | Поддерживается |
| NVIDIA Hopper Architecture | Поддерживается |
| NVIDIA Ada Lovelace Architecture | Поддерживается |
| NVIDIA Ampere Architecture | Поддерживается |
Совместимость архитектуры платформы
Dynamo совместим со следующими платформами:
| Operating System | Version | Architecture | Status |
|---|---|---|---|
| Ubuntu | 22.04 | x86_64 | Поддерживается |
| Ubuntu | 24.04 | x86_64 | Поддерживается |
| Ubuntu | 24.04 | ARM64 | Поддерживается |
| CentOS Stream | 9 | x86_64 | Экспериментально |
Wheels собираются в окружении, совместимом с manylinux_2_28, и проверяются на CentOS Stream 9 и Ubuntu (22.04, 24.04). Совместимость с другими дистрибутивами Linux ожидается, но официально не подтверждена.
Совместимость с облачными провайдерами
AWS
| Host Operating System | Version | Architecture | Status |
|---|---|---|---|
| Amazon Linux | 2023 | x86_64 | Поддерживается |
Ограничение AL2023 для TensorRT-LLM: Известна проблема с TensorRT-LLM при локальном запуске контейнера AL2023 с docker run --network host ... из-за ошибки в mpi4py. Чтобы обойти ее, замените флаг --network host на более точную сетевую конфигурацию, пробрасывая только необходимые порты (например, 4222 для nats, 2379/2380 для etcd, 8000 для frontend).
Поддержка сборки
Подробности по артефактам для конкретных версий, команды установки и историю релизов см. в Release Artifacts.
Dynamo сейчас предоставляет поддержку сборки следующими способами:
-
Wheels: Мы распространяем Python wheels для Dynamo и KV Block Manager:
- ai-dynamo
- ai-dynamo-runtime
- kvbm как самостоятельную реализацию.
-
Dynamo Container Images: Мы распространяем multi-arch образы (совместимые с x86 и ARM64) на NGC:
- Dynamo Frontend (новое в v0.8.0)
- SGLang Runtime
- SGLang Runtime (CUDA 13)
- TensorRT-LLM Runtime
- TensorRT-LLM Runtime (EFA) (новое в v1.0.0, экспериментально, только AMD64)
- vLLM Runtime
- vLLM Runtime (CUDA 13)
- vLLM Runtime (EFA) (новое в v1.0.0, экспериментально, только AMD64)
- Kubernetes Operator
- Snapshot Agent (новое в v1.0.0, предварительная версия)
-
Helm Charts: NGC размещает Helm charts для Kubernetes-развертываний Dynamo:
- Dynamo Platform (теперь включает CRD)
- Snapshot (новое в v1.0.0, предварительная версия)
- Dynamo CRDs (устарело в v1.0.0, CRD управляются Operator)
- Dynamo Graph (устарело в v0.9.0)
-
Rust Crates:
- dynamo-runtime
- dynamo-llm
- dynamo-protocols
- dynamo-parsers
- dynamo-config (New in v0.8.0)
- dynamo-memory (New in v0.8.0)
- dynamo-tokens (New in v0.9.0)
- dynamo-mocker (New in v1.0.0)
- dynamo-kv-router (New in v1.0.0)
После того как вы подтвердили совместимость платформы и архитектуры, можно установить Dynamo, следуя Быстрому старту на локальной машине в README.