Чтобы получить чистую Markdown-версию этой страницы, добавьте
.mdк этому URL. Полный индекс документации см. в https://docs.nvidia.com/dynamo/llms.txt. Полное содержимое, включая API reference и примеры SDK, см. в https://docs.nvidia.com/dynamo/llms-full.txt.
Release Artifacts
Этот документ содержит полный перечень всех артефактов релизов Dynamo, включая container images, Python wheels, Helm charts и Rust crates.
См. также: Support Matrix для совместимости оборудования и платформ | Feature Matrix для поддержки возможностей backend
История релизов в этом документе начинается с v0.6.0.
Текущий релиз: Dynamo v1.2.0
Экспериментально: v1.2.0-deepseek-v4-dev.3 (DeepSeek-V4-Flash / V4-Pro на Blackwell, только containers vLLM + SGLang) доступен как экспериментальный preview. Помеченные предрелизы и экспериментальные сборки перечислены в разделе Pre-Release Artifacts.
Образы контейнеров
| Image:Tag | Описание | Backend | CUDA | Arch | NGC | Примечания |
|---|---|---|---|---|---|---|
vllm-runtime:1.2.0 | Runtime container для backend vLLM | vLLM v0.20.1 | v12.9 | AMD64/ARM64 | NGC: vllm-runtime 1.2.0 | |
vllm-runtime:1.2.0-cuda13 | Runtime container для backend vLLM (CUDA 13) | vLLM v0.20.1 | v13.0 | AMD64/ARM64 | NGC: vllm-runtime 1.2.0-cuda13 | |
vllm-runtime:1.2.0-efa-amd64 | Runtime container для vLLM с AWS EFA | vLLM v0.20.1 | v12.9 | AMD64 | NGC: vllm-runtime 1.2.0-efa-amd64 | Экспериментально |
sglang-runtime:1.2.0 | Runtime container для backend SGLang | SGLang v0.5.11 | v12.9 | AMD64/ARM64 | NGC: sglang-runtime 1.2.0 | |
sglang-runtime:1.2.0-cuda13 | Runtime container для backend SGLang (CUDA 13) | SGLang v0.5.11 | v13.0 | AMD64/ARM64 | NGC: sglang-runtime 1.2.0-cuda13 | |
tensorrtllm-runtime:1.2.0 | Runtime container для backend TensorRT-LLM | TRT-LLM v1.3.0rc14 | v13.1 | AMD64/ARM64 | NGC: tensorrtllm-runtime 1.2.0 | |
tensorrtllm-runtime:1.2.0-efa-amd64 | Runtime container для TensorRT-LLM с AWS EFA | TRT-LLM v1.3.0rc14 | v13.1 | AMD64 | NGC: tensorrtllm-runtime 1.2.0-efa-amd64 | Экспериментально |
dynamo-frontend:1.2.0 | API gateway с Endpoint Prediction Protocol (EPP) | — | — | AMD64/ARM64 | NGC: dynamo-frontend 1.2.0 | |
dynamo-planner:1.2.0 | Отдельный образ Planner, используемый jobs Profiler и pods Planner | — | — | AMD64/ARM64 | NGC: dynamo-planner 1.2.0 | |
kubernetes-operator:1.2.0 | Kubernetes operator для развертываний Dynamo | — | — | AMD64/ARM64 | NGC: kubernetes-operator 1.2.0 | |
snapshot-agent:1.2.0 | Snapshot agent для быстрого восстановления GPU worker через CRIU | — | — | AMD64/ARM64 | NGC: snapshot-agent 1.2.0 | Предпросмотр |
Python wheels
Мы рекомендуем использовать TensorRT-LLM NGC container вместо wheel ai-dynamo[trtllm]. Список поддерживаемых образов см. в NGC container collection.
| Package | Описание | Python | Platform | PyPI |
|---|---|---|---|---|
ai-dynamo==1.2.0.post1 | Основной пакет с интеграциями backend (vLLM, SGLang, TRT-LLM) | 3.10–3.12 | Linux (glibc v2.28+) | PyPI: ai-dynamo 1.2.0.post1 |
ai-dynamo-runtime==1.2.0.post1 | Основные Python bindings для runtime Dynamo | 3.10–3.12 | Linux (glibc v2.28+) | PyPI: ai-dynamo-runtime 1.2.0.post1 |
kvbm==1.2.0.post1 | KV Block Manager для disaggregated KV cache | 3.10–3.12 | Linux (glibc v2.28+) | PyPI: kvbm 1.2.0.post1 |
Helm charts
| Chart | Описание | NGC |
|---|---|---|
dynamo-platform-1.2.0 | Сервисы платформы (etcd, NATS) и Dynamo Operator для кластера Dynamo | NGC Helm: dynamo-platform-1.2.0 |
snapshot-1.2.0 | Snapshot DaemonSet для быстрого восстановления GPU worker | NGC Helm: snapshot-1.2.0 |
Helm chart dynamo-crds устарел начиная с v1.0.0; теперь CRD управляются Dynamo Operator. Helm chart dynamo-graph устарел начиная с v0.9.0.
Rust crates
| Crate | Описание | MSRV (Rust) | crates.io |
|---|---|---|---|
dynamo-runtime@1.2.0 | Библиотека распределенного runtime core | v1.82 | crates.io: dynamo-runtime 1.2.0 |
dynamo-llm@1.2.0 | Движок LLM inference | v1.82 | crates.io: dynamo-llm 1.2.0 |
dynamo-protocols@1.2.0 | Async API client, совместимый с OpenAI | v1.82 | crates.io: dynamo-protocols 1.2.0 |
dynamo-async-openai@1.0.2 | Устаревший legacy OpenAI client; используйте dynamo-protocols | v1.82 | crates.io: dynamo-async-openai 1.0.2 |
dynamo-parsers@1.2.0 | Парсеры протокола (SSE, JSON streaming) | v1.82 | crates.io: dynamo-parsers 1.2.0 |
dynamo-memory@1.2.0 | Утилиты управления памятью | v1.82 | crates.io: dynamo-memory 1.2.0 |
dynamo-config@1.2.0 | Управление конфигурацией | v1.82 | crates.io: dynamo-config 1.2.0 |
dynamo-tokens@1.2.0 | Bindings для tokenizer в LLM inference | v1.82 | crates.io: dynamo-tokens 1.2.0 |
dynamo-tokenizers@1.2.0 | Библиотека tokenizer для LLM inference | v1.82 | crates.io: dynamo-tokenizers 1.2.0 |
dynamo-mocker@1.2.0 | Симулятор inference engine для бенчмаркинга | v1.82 | crates.io: dynamo-mocker 1.2.0 |
dynamo-kv-router@1.2.0 | Библиотека маршрутизации запросов с учетом KV | v1.82 | crates.io: dynamo-kv-router 1.2.0 |
kvbm-logical@1.2.0 | Логический слой для KV Block Manager | v1.82 | crates.io: kvbm-logical 1.2.0 |
Команды быстрой установки
Образы контейнеров (NGC)
Подробные инструкции по запуску см. в руководствах для соответствующих backend: vLLM | SGLang | TensorRT-LLM
# Runtime containers
docker pull nvcr.io/nvidia/ai-dynamo/vllm-runtime:1.2.0
docker pull nvcr.io/nvidia/ai-dynamo/sglang-runtime:1.2.0
docker pull nvcr.io/nvidia/ai-dynamo/tensorrtllm-runtime:1.2.0
# CUDA 13 variants
docker pull nvcr.io/nvidia/ai-dynamo/vllm-runtime:1.2.0-cuda13
docker pull nvcr.io/nvidia/ai-dynamo/sglang-runtime:1.2.0-cuda13
# EFA variants (AWS, AMD64 only, experimental)
docker pull nvcr.io/nvidia/ai-dynamo/vllm-runtime:1.2.0-efa-amd64
docker pull nvcr.io/nvidia/ai-dynamo/tensorrtllm-runtime:1.2.0-efa-amd64
# Infrastructure containers
docker pull nvcr.io/nvidia/ai-dynamo/dynamo-frontend:1.2.0
docker pull nvcr.io/nvidia/ai-dynamo/dynamo-planner:1.2.0
docker pull nvcr.io/nvidia/ai-dynamo/kubernetes-operator:1.2.0
docker pull nvcr.io/nvidia/ai-dynamo/snapshot-agent:1.2.0
Python wheels (PyPI)
Подробные инструкции по установке см. в разделе Local Quick Start в README.
# Установить Dynamo с определенным backend (рекомендуется)
uv pip install "ai-dynamo[vllm]==1.2.0.post1"
uv pip install --prerelease=allow "ai-dynamo[sglang]==1.2.0.post1"
# TensorRT-LLM requires the NVIDIA PyPI index and pip
pip install --pre --extra-index-url https://pypi.nvidia.com "ai-dynamo[trtllm]==1.2.0.post1"
# Установить только core Dynamo
uv pip install ai-dynamo==1.2.0.post1
# Установить standalone KVBM
uv pip install kvbm==1.2.0.post1
Helm charts (NGC)
Инструкции по развертыванию в Kubernetes см. в Kubernetes Installation Guide.
helm install dynamo-platform oci://helm.ngc.nvidia.com/nvidia/ai-dynamo/charts/dynamo-platform --version 1.2.0
helm install snapshot oci://helm.ngc.nvidia.com/nvidia/ai-dynamo/charts/snapshot --version 1.2.0
Rust crates (crates.io)
Документацию по API см. на странице каждого crate в docs.rs. Чтобы собрать Dynamo из исходников, см. Building from Source.
cargo add dynamo-runtime@1.2.0
cargo add dynamo-llm@1.2.0
cargo add dynamo-protocols@1.2.0
# Устаревшее legacy crate name — закрепляйте только если это требуется зависимостью; новый код должен использовать dynamo-protocols:
# cargo add dynamo-async-openai@1.0.2
cargo add dynamo-parsers@1.2.0
cargo add dynamo-memory@1.2.0
cargo add dynamo-config@1.2.0
cargo add dynamo-tokens@1.2.0
cargo add dynamo-tokenizers@1.2.0
cargo add dynamo-mocker@1.2.0
cargo add dynamo-kv-router@1.2.0
cargo add kvbm-logical@1.2.0
CUDA and Driver Requirements: Подробные версии CUDA toolkit и минимальные требования к driver для каждого container image см. в Support Matrix.
Известные проблемы
Полный список известных проблем см. в release notes для каждой версии:
- Примечания к выпуску v1.2.0
- Примечания к выпуску v1.1.1
- Примечания к выпуску v1.1.0
- Примечания к выпуску v1.0.2
- Примечания к выпуску v1.0.1
- Примечания к выпуску v1.0.0
- Примечания к выпуску v0.9.0
- Примечания к выпуску v0.8.1
Известные проблемы с артефактами
| Версия | Артефакт | Проблема | Статус |
|---|---|---|---|
| v0.9.0 | dynamo-platform-0.9.0 | Helm chart задает для image operator значение 0.7.1 вместо 0.9.0. | Исправлено в v0.9.0.post1 |
| v0.8.1 | vllm-runtime:0.8.1-cuda13 | Container не запускается. | Известная проблема |
| v0.8.1 | sglang-runtime:0.8.1-cuda13, vllm-runtime:0.8.1-cuda13 | Multimodality не ожидается работающей на ARM64. На AMD64 работает. | Известное ограничение |
| v0.8.0 | sglang-runtime:0.8.0-cuda13 | Проблема установки CuDNN вызвала проблемы совместимости PyTorch v2.9.1 с nn.Conv3d, что привело к деградации производительности и чрезмерному использованию памяти в multimodal workloads. | Исправлено в v0.8.1 (#5461) |
История артефактов релизов
Каждый пункт ниже описывает дельту относительно того, что поставляется в NGC / Helm / PyPI / crates.io: новые crates, удаленные Helm charts или строки образов, которые разделились или появились в registry. Полные матрицы см. в таблицах инвентаризации выше.
Сначала идут стабильные релизы (от новых к старым). Теги pre-release Git (v*-dev.*, experimental tracks) кратко описаны ниже; образы и wheels для каждого тега перечислены в Артефакты pre-release.
Для закрепленных версий backend см. таблицу version-pins выше и таблицу GitHub Releases ниже.
Стабильные релизы
- v1.2.0: Минорный релиз (603 PR от 82 авторов начиная с v1.1.1). Backends: SGLang
v0.5.11(NIXLv1.0.1), TRT-LLMv1.3.0rc14(NIXLv0.10.1), vLLMv0.20.1(NIXLv0.10.1); UCXv1.20.0. APIs: DGD/DGDR переведены вv1beta1(миграция сv1alpha1); поля конфигурации duration переименованы с явными суффиксами единиц (например,*_ttl→*_ttl_secs). Routing: CRTC стал default approximate KV router; Branch-Sharded KV Indexer. Deploy: Inter-pod GMS sidecar заменяет per-pod pattern; Dynamo Snapshot на CRI-O / OpenShift. Models: DeepSeek-V4 на vLLM; multimodal/diffusion (TRT-LLM text-to-image, SGLang disaggregated video). Примечание: container images с CUDA 12 прекращают выпускаться начиная с v1.3.0. - v1.1.1: Патч-релиз. Те же версии backend, что и в v1.1.0: SGLang
v0.5.10.post1(NIXLv1.0.1), TRT-LLMv1.3.0rc11(NIXLv0.10.1), vLLMv0.19.0(NIXLv0.10.1). - v1.1.0: Images: Planner вынесен в отдельный образ
dynamo-plannerна NGC для jobs Profiler и pods Planner; worker-образы и runtime-образы больше не включают Planner (изменение границы артефакта, а не новая возможность engine). Crates: Первое опубликование на crates.io дляdynamo-protocolsв ветке1.y.z(multi-protocol types;dynamo-async-openaiостается устаревшим с финальным релизом1.0.2). - v1.0.2 / v1.0.1: По сравнению с v1.0.0 нет ни новых артефактов, ни удаленных.
- v1.0.0: Images:
snapshot-agent, а также EFA-варианты для vLLM и TRT-LLM (только AMD64). Crates: Первое опубликованиеdynamo-mocker,dynamo-kv-router. Helm: Добавленsnapshot(preview); deprecateddynamo-crdsубран из потока публикации (CRD теперь принадлежат Operator). - v0.9.1: По сравнению с v0.9.0 нет ни новых артефактов, ни удаленных.
- v0.9.0: Crates: Первое опубликование
dynamo-tokens. Helm: Deprecateddynamo-graphубран из потока публикации. - v0.8.0: Images:
dynamo-frontend, варианты CUDA 13 для vLLM и SGLang. Crates: Первое опубликованиеdynamo-memory,dynamo-config.
Dynamo Nightlies
- Начиная с v1.1.0*:
ai-dynamoиai-dynamo-runtime— nightly builds изmainпубликуют wheels с тегами*.devYYYYMMDD. Устанавливайте их черезpipилиuv, используя--preи тот же pattern дополнительного NVIDIA index, что и в Предрелизные артефакты.
* Версионирование *.devYYYYMMDD для nightly main wheels началось Apr 24, 2026.
Теги Git предрелиза и experimental
- v1.2.0-deepseek-v4-dev.3: Images:
vllm-runtime:*-deepseek-v4-cuda13-dev.3,sglang-runtime:*-deepseek-v4-cuda12-dev.3,sglang-runtime:*-deepseek-v4-cuda13-dev.3. Helm / PyPI: Для этого тега не публикуются (см. Предрелизные артефакты). - v1.1.0-dev.3: Images:
tensorrtllm-runtime:1.1.0-dev.3. Wheels:ai-dynamo,ai-dynamo-runtimeна pypi.nvidia.com (см. ниже). - v1.1.0-dev.2: Images:
sglang-runtime:1.1.0-dev.2,tensorrtllm-runtime:1.1.0-dev.2. Wheels:ai-dynamo,ai-dynamo-runtimeна pypi.nvidia.com (см. ниже). - v1.1.0-dev.1: Images: матрица runtime для vLLM, SGLang и TRT-LLM (как указано, варианты CUDA 12 / 13 и EFA),
dynamo-frontend,kubernetes-operator,snapshot-agent. Wheels:ai-dynamo,ai-dynamo-runtimeна pypi.nvidia.com. Helm:dynamo-platform,snapshotверсии1.1.0-dev.1(см. ниже).
Патчи только для Helm
- v0.9.0.post1: Перепубликован только Helm chart
dynamo-platform(исправлен тег image operator).
Патч-трейны только для backend
- v0.8.1.post1 / .post2 / .post3: Перепубликованы только runtime image TRT-LLM и PyPI wheels.
Rust Packages на crates.io
Эти crates используют repository https://github.com/ai-dynamo/dynamo.git. В таблице показана первая не-placeholder публикация каждого crate на crates.io (без reservation uploads с именем 0.0.0-prerelease.0). Даты взяты из index crates.io.
| Crate | Первая опубликованная версия | Дата (crates.io) |
|---|---|---|
dynamo-runtime | 0.1.0 | 2025-03-18 |
dynamo-llm | 0.2.0 | 2025-05-01 |
dynamo-async-openai | 0.4.1 | 2025-08-27 |
dynamo-parsers | 0.5.0 | 2025-09-18 |
dynamo-memory | 0.8.0 | 2026-01-15 |
dynamo-config | 0.8.0 | 2026-01-15 |
dynamo-tokens | 0.9.0 | 2026-02-12 |
dynamo-tokenizers | 1.2.0 | 2026-06-02 |
dynamo-mocker | 1.0.0 | 2026-03-13 |
dynamo-kv-router | 1.0.0 | 2026-03-13 |
dynamo-protocols | 1.1.0 | 2026-05-04 |
dynamo-async-openai устарел; 1.0.2 — его финальный release на crates.io. Для новых зависимостей используйте dynamo-protocols (crate).
dynamo-tokenizers впервые опубликован на crates.io в версии 1.2.0 (placeholder reservation 0.0.0-prerelease.0 здесь опущен, как и другие reservation uploads).
GitHub Releases
| Версия | Дата релиза | GitHub | Docs | Примечания |
|---|---|---|---|---|
v1.2.0 | Jun 2, 2026 | Release | Docs | |
v1.2.0-deepseek-v4-dev.3 | May 9, 2026 | Tag | — | Экспериментально (DeepSeek-V4-Flash / V4-Pro Blackwell preview; только vLLM + SGLang containers) |
v1.2.0-deepseek-v4-dev.2 | May 1, 2026 | Tag | — | Экспериментально (DeepSeek-V4-Flash / V4-Pro Blackwell preview; только vLLM + SGLang containers) |
v1.1.1 | May 5, 2026 | Release | Docs | |
v1.1.0 | May 1, 2026 | Release | Docs | |
v1.1.0-dev.3 | Apr 18, 2026 | Tag | — | Pre-Release (TRT-LLM Runtime Image + Wheels; см. Артефакты pre-release) |
v1.1.0-dev.2 | Apr 9, 2026 | Tag | — | Pre-Release (SGLang + TRT-LLM Runtime Images + Wheels; см. Артефакты pre-release) |
v1.1.0-dev.1 | Mar 17, 2026 | Tag | — | Экспериментально |
v1.0.2 | Apr 22, 2026 | Release | Docs | |
v1.0.1 | Mar 16, 2026 | Release | Docs | |
v1.0.0 | Mar 12, 2026 | Release | Docs | |
v0.9.1 | Mar 4, 2026 | Release | Docs | |
v0.9.0 | Feb 11, 2026 | Release | Archived docs unavailable | |
v0.8.1 | Jan 23, 2026 | Release | Archived docs unavailable | |
v0.8.0 | Jan 15, 2026 | Release | Archived docs unavailable | |
v0.7.1 | Dec 15, 2025 | Release | Archived docs unavailable | |
v0.7.0 | Nov 26, 2025 | Release | Archived docs unavailable | |
v0.6.1 | Nov 6, 2025 | Release | — | |
v0.6.0 | Oct 28, 2025 | Release | — |
Образы контейнеров
NGC Collection: ai-dynamo
Чтобы открыть конкретную версию, добавьте
?version=TAGк URL container:https://catalog.ngc.nvidia.com/orgs/nvidia/teams/ai-dynamo/containers/{container}?version={tag}
vllm-runtime
| Image:Tag | vLLM | Arch | CUDA | Примечания |
|---|---|---|---|---|
vllm-runtime:1.2.0 | v0.20.1 | AMD64/ARM64 | v12.9 | |
vllm-runtime:1.2.0-cuda13 | v0.20.1 | AMD64/ARM64 | v13.0 | |
vllm-runtime:1.2.0-efa-amd64 | v0.20.1 | AMD64 | v12.9 | Экспериментально |
vllm-runtime:1.1.1 | v0.19.0 | AMD64/ARM64 | v12.9 | |
vllm-runtime:1.1.1-cuda13 | v0.19.0 | AMD64/ARM64 | v13.0 | |
vllm-runtime:1.1.1-efa-amd64 | v0.19.0 | AMD64 | v12.9 | Экспериментально |
vllm-runtime:1.1.0 | v0.19.0 | AMD64/ARM64 | v12.9 | |
vllm-runtime:1.1.0-cuda13 | v0.19.0 | AMD64/ARM64 | v13.0 | |
vllm-runtime:1.1.0-efa-amd64 | v0.19.0 | AMD64 | v12.9 | Экспериментально |
vllm-runtime:1.0.2 | v0.16.0 | AMD64/ARM64 | v12.9 | |
vllm-runtime:1.0.2-cuda13 | v0.16.0 | AMD64/ARM64 | v13.0 | |
vllm-runtime:1.0.2-efa-amd64 | v0.16.0 | AMD64 | v12.9 | Экспериментально |
vllm-runtime:1.0.1 | v0.16.0 | AMD64/ARM64 | v12.9 | |
vllm-runtime:1.0.1-cuda13 | v0.16.0 | AMD64/ARM64 | v13.0 | |
vllm-runtime:1.0.1-efa-amd64 | v0.16.0 | AMD64 | v12.9 | Экспериментально |
vllm-runtime:1.0.0 | v0.16.0 | AMD64/ARM64 | v12.9 | |
vllm-runtime:1.0.0-cuda13 | v0.16.0 | AMD64/ARM64 | v13.0 | |
vllm-runtime:1.0.0-efa-amd64 | v0.16.0 | AMD64 | v12.9 | Экспериментально |
vllm-runtime:0.9.1 | v0.14.1 | AMD64/ARM64 | v12.9 | |
vllm-runtime:0.9.1-cuda13 | v0.14.1 | AMD64/ARM64 | v13.0 | Экспериментально |
vllm-runtime:0.9.0 | v0.14.1 | AMD64/ARM64 | v12.9 | |
vllm-runtime:0.9.0-cuda13 | v0.14.1 | AMD64/ARM64 | v13.0 | Экспериментально |
vllm-runtime:0.8.1 | v0.12.0 | AMD64/ARM64 | v12.9 | |
vllm-runtime:0.8.0 | v0.12.0 | AMD64/ARM64 | v12.9 | |
vllm-runtime:0.8.0-cuda13 | v0.12.0 | AMD64/ARM64 | v13.0 | Экспериментально |
vllm-runtime:0.7.0.post2 | v0.11.2 | AMD64/ARM64 | v12.8 | Патч |
vllm-runtime:0.7.1 | v0.11.0 | AMD64/ARM64 | v12.8 | |
vllm-runtime:0.7.0.post1 | v0.11.0 | AMD64/ARM64 | v12.8 | Патч |
vllm-runtime:0.7.0 | v0.11.0 | AMD64/ARM64 | v12.8 | |
vllm-runtime:0.6.1.post1 | v0.11.0 | AMD64/ARM64 | v12.8 | Патч |
vllm-runtime:0.6.1 | v0.11.0 | AMD64/ARM64 | v12.8 | |
vllm-runtime:0.6.0 | v0.11.0 | AMD64 | v12.8 |
sglang-runtime
| Image:Tag | SGLang | Arch | CUDA | Примечания |
|---|---|---|---|---|
sglang-runtime:1.2.0 | v0.5.11 | AMD64/ARM64 | v12.9 | |
sglang-runtime:1.2.0-cuda13 | v0.5.11 | AMD64/ARM64 | v13.0 | |
sglang-runtime:1.1.1 | v0.5.10.post1 | AMD64/ARM64 | v12.9 | |
sglang-runtime:1.1.1-cuda13 | v0.5.10.post1 | AMD64/ARM64 | v13.0 | |
sglang-runtime:1.1.0 | v0.5.10.post1 | AMD64/ARM64 | v12.9 | |
sglang-runtime:1.1.0-cuda13 | v0.5.10.post1 | AMD64/ARM64 | v13.0 | |
sglang-runtime:1.0.2 | v0.5.9 | AMD64/ARM64 | v12.9 | |
sglang-runtime:1.0.2-cuda13 | v0.5.9 | AMD64/ARM64 | v13.0 | |
sglang-runtime:1.0.1 | v0.5.9 | AMD64/ARM64 | v12.9 | |
sglang-runtime:1.0.1-cuda13 | v0.5.9 | AMD64/ARM64 | v13.0 | |
sglang-runtime:1.0.0 | v0.5.9 | AMD64/ARM64 | v12.9 | |
sglang-runtime:1.0.0-cuda13 | v0.5.9 | AMD64/ARM64 | v13.0 | |
sglang-runtime:0.9.1 | v0.5.8 | AMD64/ARM64 | v12.9 | |
sglang-runtime:0.9.1-cuda13 | v0.5.8 | AMD64/ARM64 | v13.0 | Экспериментально |
sglang-runtime:0.9.0 | v0.5.8 | AMD64/ARM64 | v12.9 | |
sglang-runtime:0.9.0-cuda13 | v0.5.8 | AMD64/ARM64 | v13.0 | Экспериментально |
sglang-runtime:0.8.1 | v0.5.6.post2 | AMD64/ARM64 | v12.9 | |
sglang-runtime:0.8.1-cuda13 | v0.5.6.post2 | AMD64/ARM64 | v13.0 | Экспериментально |
sglang-runtime:0.8.0 | v0.5.6.post2 | AMD64/ARM64 | v12.9 | |
sglang-runtime:0.8.0-cuda13 | v0.5.6.post2 | AMD64/ARM64 | v13.0 | Экспериментально |
sglang-runtime:0.7.1 | v0.5.4.post3 | AMD64/ARM64 | v12.9 | |
sglang-runtime:0.7.0.post1 | v0.5.4.post3 | AMD64/ARM64 | v12.9 | Патч |
sglang-runtime:0.7.0 | v0.5.4.post3 | AMD64/ARM64 | v12.9 | |
sglang-runtime:0.6.1.post1 | v0.5.3.post2 | AMD64/ARM64 | v12.9 | Патч |
sglang-runtime:0.6.1 | v0.5.3.post2 | AMD64/ARM64 | v12.9 | |
sglang-runtime:0.6.0 | v0.5.3.post2 | AMD64 | v12.8 |
tensorrtllm-runtime
| Image:Tag | TRT-LLM | Arch | CUDA | Примечания |
|---|---|---|---|---|
tensorrtllm-runtime:1.2.0 | v1.3.0rc14 | AMD64/ARM64 | v13.1 | |
tensorrtllm-runtime:1.2.0-efa-amd64 | v1.3.0rc14 | AMD64 | v13.1 | Экспериментально |
tensorrtllm-runtime:1.1.1 | v1.3.0rc11 | AMD64/ARM64 | v13.1 | |
tensorrtllm-runtime:1.1.1-efa-amd64 | v1.3.0rc11 | AMD64 | v13.1 | Экспериментально |
tensorrtllm-runtime:1.1.0 | v1.3.0rc11 | AMD64/ARM64 | v13.1 | |
tensorrtllm-runtime:1.1.0-efa-amd64 | v1.3.0rc11 | AMD64 | v13.1 | Экспериментально |
tensorrtllm-runtime:1.0.2 | v1.3.0rc5.post1 | AMD64/ARM64 | v13.1 | |
tensorrtllm-runtime:1.0.2-efa-amd64 | v1.3.0rc5.post1 | AMD64 | v13.1 | Экспериментально |
tensorrtllm-runtime:1.0.1 | v1.3.0rc5.post1 | AMD64/ARM64 | v13.1 | |
tensorrtllm-runtime:1.0.1-efa-amd64 | v1.3.0rc5.post1 | AMD64 | v13.1 | Экспериментально |
tensorrtllm-runtime:1.0.0 | v1.3.0rc5.post1 | AMD64/ARM64 | v13.1 | |
tensorrtllm-runtime:1.0.0-efa-amd64 | v1.3.0rc5.post1 | AMD64 | v13.1 | Экспериментально |
tensorrtllm-runtime:0.9.1 | v1.3.0rc3 | AMD64/ARM64 | v13.0 | |
tensorrtllm-runtime:0.9.0 | v1.3.0rc1 | AMD64/ARM64 | v13.0 | |
tensorrtllm-runtime:0.8.1.post3 | v1.2.0rc6.post3 | AMD64/ARM64 | v13.0 | Патч |
tensorrtllm-runtime:0.8.1.post1 | v1.2.0rc6.post2 | AMD64/ARM64 | v13.0 | Патч |
tensorrtllm-runtime:0.8.1 | v1.2.0rc6.post1 | AMD64/ARM64 | v13.0 | |
tensorrtllm-runtime:0.8.0 | v1.2.0rc6.post1 | AMD64/ARM64 | v13.0 | |
tensorrtllm-runtime:0.7.0.post2 | v1.2.0rc2 | AMD64/ARM64 | v13.0 | Патч |
tensorrtllm-runtime:0.7.1 | v1.2.0rc3 | AMD64/ARM64 | v13.0 | |
tensorrtllm-runtime:0.7.0.post1 | v1.2.0rc3 | AMD64/ARM64 | v13.0 | Патч |
tensorrtllm-runtime:0.7.0 | v1.2.0rc2 | AMD64/ARM64 | v13.0 | |
tensorrtllm-runtime:0.6.1-cuda13 | v1.2.0rc1 | AMD64/ARM64 | v13.0 | Экспериментально |
tensorrtllm-runtime:0.6.1.post1 | v1.1.0rc5 | AMD64/ARM64 | v12.9 | Patch |
tensorrtllm-runtime:0.6.1 | v1.1.0rc5 | AMD64/ARM64 | v12.9 | |
tensorrtllm-runtime:0.6.0 | v1.1.0rc5 | AMD64/ARM64 | v12.9 |
dynamo-frontend
| Image:Tag | Arch | Примечания |
|---|---|---|
dynamo-frontend:1.2.0 | AMD64/ARM64 | |
dynamo-frontend:1.1.1 | AMD64/ARM64 | |
dynamo-frontend:1.1.0 | AMD64/ARM64 | |
dynamo-frontend:1.0.2 | AMD64/ARM64 | |
dynamo-frontend:1.0.1 | AMD64/ARM64 | |
dynamo-frontend:1.0.0 | AMD64/ARM64 | |
dynamo-frontend:0.9.1 | AMD64/ARM64 | |
dynamo-frontend:0.9.0 | AMD64/ARM64 | |
dynamo-frontend:0.8.1 | AMD64/ARM64 | |
dynamo-frontend:0.8.0 | AMD64/ARM64 | Первый выпуск |
kubernetes-operator
| Image:Tag | Arch | Примечания |
|---|---|---|
kubernetes-operator:1.2.0 | AMD64/ARM64 | |
kubernetes-operator:1.1.1 | AMD64/ARM64 | |
kubernetes-operator:1.1.0 | AMD64/ARM64 | |
kubernetes-operator:1.0.2 | AMD64/ARM64 | |
kubernetes-operator:1.0.1 | AMD64/ARM64 | |
kubernetes-operator:1.0.0 | AMD64/ARM64 | |
kubernetes-operator:0.9.1 | AMD64/ARM64 | |
kubernetes-operator:0.9.0 | AMD64/ARM64 | |
kubernetes-operator:0.8.1 | AMD64/ARM64 | |
kubernetes-operator:0.8.0 | AMD64/ARM64 | |
kubernetes-operator:0.7.1 | AMD64/ARM64 | |
kubernetes-operator:0.7.0.post1 | AMD64/ARM64 | Патч |
kubernetes-operator:0.7.0 | AMD64/ARM64 | |
kubernetes-operator:0.6.1 | AMD64/ARM64 | |
kubernetes-operator:0.6.0 | AMD64/ARM64 |
dynamo-planner
| Image:Tag | Arch | Примечания |
|---|---|---|
dynamo-planner:1.2.0 | AMD64/ARM64 | |
dynamo-planner:1.1.1 | AMD64/ARM64 | |
dynamo-planner:1.1.0 | AMD64/ARM64 | Новый |
snapshot-agent
| Image:Tag | Arch | Примечания |
|---|---|---|
snapshot-agent:1.2.0 | AMD64/ARM64 | Предпросмотр |
snapshot-agent:1.1.1 | AMD64/ARM64 | Предпросмотр |
snapshot-agent:1.1.0 | AMD64/ARM64 | Предпросмотр |
snapshot-agent:1.0.2 | AMD64/ARM64 | Предпросмотр |
snapshot-agent:1.0.1 | AMD64/ARM64 | Предпросмотр |
snapshot-agent:1.0.0 | AMD64/ARM64 | Предпросмотр |
Python wheels
PyPI: ai-dynamo | ai-dynamo-runtime | kvbm
Чтобы открыть конкретную версию:
https://pypi.org/project/{package}/{version}/
ai-dynamo (wheel)
| Package | Python | Platform | Примечания |
|---|---|---|---|
ai-dynamo==1.2.0.post1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==1.1.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==1.1.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==1.0.2 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==1.0.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==1.0.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.9.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.9.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.8.1.post3 | 3.10–3.12 | Linux (glibc v2.28+) | TRT-LLM v1.2.0rc6.post3 |
ai-dynamo==0.8.1.post1 | 3.10–3.12 | Linux (glibc v2.28+) | TRT-LLM v1.2.0rc6.post2 |
ai-dynamo==0.8.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.8.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.7.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.7.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.6.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo==0.6.0 | 3.10–3.12 | Linux (glibc v2.28+) |
ai-dynamo-runtime (wheel)
| Package | Python | Platform | Примечания |
|---|---|---|---|
ai-dynamo-runtime==1.2.0.post1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==1.1.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==1.1.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==1.0.2 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==1.0.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==1.0.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.9.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.9.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.8.1.post3 | 3.10–3.12 | Linux (glibc v2.28+) | TRT-LLM v1.2.0rc6.post3 |
ai-dynamo-runtime==0.8.1.post1 | 3.10–3.12 | Linux (glibc v2.28+) | TRT-LLM v1.2.0rc6.post2 |
ai-dynamo-runtime==0.8.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.8.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.7.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.7.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.6.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
ai-dynamo-runtime==0.6.0 | 3.10–3.12 | Linux (glibc v2.28+) |
kvbm (wheel)
| Package | Python | Platform | Примечания |
|---|---|---|---|
kvbm==1.2.0.post1 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==1.1.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==1.1.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==1.0.2 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==1.0.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==1.0.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==0.9.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==0.9.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==0.8.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==0.8.0 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==0.7.1 | 3.10–3.12 | Linux (glibc v2.28+) | |
kvbm==0.7.0 | 3.10–3.12 | Linux (glibc v2.28+) | Первый выпуск |
Helm charts
NGC Helm Registry: ai-dynamo
Direct download:
https://helm.ngc.nvidia.com/nvidia/ai-dynamo/charts/{chart}-{version}.tgz
dynamo-crds (Helm chart) -- устарел
The dynamo-crds Helm chart is deprecated as of v1.0.0. CRDs are now managed by the Dynamo Operator.
| Chart | Примечания |
|---|---|
dynamo-crds-0.9.1 | Последний выпуск |
dynamo-crds-0.9.0 | |
dynamo-crds-0.8.1 | |
dynamo-crds-0.8.0 | |
dynamo-crds-0.7.1 | |
dynamo-crds-0.7.0 | |
dynamo-crds-0.6.1 | |
dynamo-crds-0.6.0 |
dynamo-platform (Helm chart)
| Chart | Примечания |
|---|---|
dynamo-platform-1.2.0 | |
dynamo-platform-1.1.1 | |
dynamo-platform-1.1.0 | |
dynamo-platform-1.0.2 | |
dynamo-platform-1.0.1 | |
dynamo-platform-1.0.0 | |
dynamo-platform-0.9.1 | |
dynamo-platform-0.9.0-post1 | Helm fix: operator image tag |
dynamo-platform-0.9.0 | |
dynamo-platform-0.8.1 | |
dynamo-platform-0.8.0 | |
dynamo-platform-0.7.1 | |
dynamo-platform-0.7.0 | |
dynamo-platform-0.6.1 | |
dynamo-platform-0.6.0 |
snapshot (Helm chart)
| Chart | Примечания |
|---|---|
snapshot-1.2.0 | Предпросмотр |
snapshot-1.1.1 | Предпросмотр |
snapshot-1.1.0 | Предпросмотр |
snapshot-1.0.2 | Предпросмотр |
snapshot-1.0.1 | Предпросмотр |
snapshot-1.0.0 | Предпросмотр |
dynamo-graph (Helm chart) -- устарел
dynamo-graph устарел начиная с v0.9.0.| Chart | Примечания |
|---|---|
dynamo-graph-0.8.1 | Последний выпуск |
dynamo-graph-0.8.0 | |
dynamo-graph-0.7.1 | |
dynamo-graph-0.7.0 | |
dynamo-graph-0.6.1 | |
dynamo-graph-0.6.0 |
Rust crates
crates.io: dynamo-runtime | dynamo-llm | dynamo-protocols | dynamo-async-openai (deprecated) | dynamo-parsers | dynamo-memory | dynamo-config | dynamo-tokens | dynamo-tokenizers | kvbm-logical
Чтобы открыть конкретную версию:
https://crates.io/crates/{crate}/{version}
dynamo-runtime (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-runtime@1.2.0 | v1.82 | |
dynamo-runtime@1.1.1 | v1.82 | |
dynamo-runtime@1.1.0 | v1.82 | |
dynamo-runtime@1.0.2 | v1.82 | |
dynamo-runtime@1.0.1 | v1.82 | |
dynamo-runtime@1.0.0 | v1.82 | |
dynamo-runtime@0.9.1 | v1.82 | |
dynamo-runtime@0.9.0 | v1.82 | |
dynamo-runtime@0.8.1 | v1.82 | |
dynamo-runtime@0.8.0 | v1.82 | |
dynamo-runtime@0.7.1 | v1.82 | |
dynamo-runtime@0.7.0 | v1.82 | |
dynamo-runtime@0.6.1 | v1.82 | |
dynamo-runtime@0.6.0 | v1.82 |
dynamo-llm (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-llm@1.2.0 | v1.82 | |
dynamo-llm@1.1.1 | v1.82 | |
dynamo-llm@1.1.0 | v1.82 | |
dynamo-llm@1.0.2 | v1.82 | |
dynamo-llm@1.0.1 | v1.82 | |
dynamo-llm@1.0.0 | v1.82 | |
dynamo-llm@0.9.1 | v1.82 | |
dynamo-llm@0.9.0 | v1.82 | |
dynamo-llm@0.8.1 | v1.82 | |
dynamo-llm@0.8.0 | v1.82 | |
dynamo-llm@0.7.1 | v1.82 | |
dynamo-llm@0.7.0 | v1.82 | |
dynamo-llm@0.6.1 | v1.82 | |
dynamo-llm@0.6.0 | v1.82 |
dynamo-protocols (crate)
На crates.io dynamo-protocols указывает 1.1.0 как первую installable release (placeholder reservation 0.0.0-prerelease.0 здесь опущен, как и другие 0.0.0-prerelease.* uploads). Более ранние semver-линии для OpenAI-compatible client публиковались под dynamo-async-openai — см. #### dynamo-async-openai (crate) ниже.
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-protocols@1.2.0 | v1.82 | |
dynamo-protocols@1.1.1 | v1.82 | |
dynamo-protocols@1.1.0 | v1.82 |
dynamo-async-openai (crate)
Устарел. Предпочитайте dynamo-protocols. Этот crate по-прежнему публикуется на crates.io для manifests, закрепленных за старым package name.
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-async-openai@1.0.2 | v1.82 | Финальный выпуск на crates.io |
dynamo-async-openai@1.0.1 | v1.82 | |
dynamo-async-openai@1.0.0 | v1.82 | |
dynamo-async-openai@0.9.1 | v1.82 | |
dynamo-async-openai@0.9.0 | v1.82 | |
dynamo-async-openai@0.8.1 | v1.82 | |
dynamo-async-openai@0.8.0 | v1.82 | |
dynamo-async-openai@0.7.1 | v1.82 | |
dynamo-async-openai@0.7.0 | v1.82 | |
dynamo-async-openai@0.7.0-post1 | v1.82 | |
dynamo-async-openai@0.6.1 | v1.82 | |
dynamo-async-openai@0.6.0 | v1.82 | |
dynamo-async-openai@0.5.1 | v1.82 | |
dynamo-async-openai@0.5.0 | v1.82 | |
dynamo-async-openai@0.4.1 | v1.82 |
dynamo-parsers (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-parsers@1.2.0 | v1.82 | |
dynamo-parsers@1.1.1 | v1.82 | |
dynamo-parsers@1.1.0 | v1.82 | |
dynamo-parsers@1.0.2 | v1.82 | |
dynamo-parsers@1.0.1 | v1.82 | |
dynamo-parsers@1.0.0 | v1.82 | |
dynamo-parsers@0.9.1 | v1.82 | |
dynamo-parsers@0.9.0 | v1.82 | |
dynamo-parsers@0.8.1 | v1.82 | |
dynamo-parsers@0.8.0 | v1.82 | |
dynamo-parsers@0.7.1 | v1.82 | |
dynamo-parsers@0.7.0 | v1.82 | |
dynamo-parsers@0.6.1 | v1.82 | |
dynamo-parsers@0.6.0 | v1.82 |
dynamo-memory (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-memory@1.2.0 | v1.82 | |
dynamo-memory@1.1.1 | v1.82 | |
dynamo-memory@1.1.0 | v1.82 | |
dynamo-memory@1.0.2 | v1.82 | |
dynamo-memory@1.0.1 | v1.82 | |
dynamo-memory@1.0.0 | v1.82 | |
dynamo-memory@0.9.1 | v1.82 | |
dynamo-memory@0.9.0 | v1.82 | |
dynamo-memory@0.8.1 | v1.82 | |
dynamo-memory@0.8.0 | v1.82 | Первый выпуск |
dynamo-config (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-config@1.2.0 | v1.82 | |
dynamo-config@1.1.1 | v1.82 | |
dynamo-config@1.1.0 | v1.82 | |
dynamo-config@1.0.2 | v1.82 | |
dynamo-config@1.0.1 | v1.82 | |
dynamo-config@1.0.0 | v1.82 | |
dynamo-config@0.9.1 | v1.82 | |
dynamo-config@0.9.0 | v1.82 | |
dynamo-config@0.8.1 | v1.82 | |
dynamo-config@0.8.0 | v1.82 | Первый выпуск |
dynamo-tokens (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-tokens@1.2.0 | v1.82 | |
dynamo-tokens@1.1.1 | v1.82 | |
dynamo-tokens@1.1.0 | v1.82 | |
dynamo-tokens@1.0.2 | v1.82 | |
dynamo-tokens@1.0.1 | v1.82 | |
dynamo-tokens@1.0.0 | v1.82 | |
dynamo-tokens@0.9.1 | v1.82 | |
dynamo-tokens@0.9.0 | v1.82 | Первый выпуск |
dynamo-tokenizers (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-tokenizers@1.2.0 | v1.82 | Первый выпуск |
dynamo-mocker (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-mocker@1.2.0 | v1.82 | |
dynamo-mocker@1.1.1 | v1.82 | |
dynamo-mocker@1.1.0 | v1.82 | |
dynamo-mocker@1.0.2 | v1.82 | |
dynamo-mocker@1.0.1 | v1.82 | |
dynamo-mocker@1.0.0 | v1.82 | Первый выпуск |
dynamo-kv-router (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
dynamo-kv-router@1.2.0 | v1.82 | |
dynamo-kv-router@1.1.1 | v1.82 | |
dynamo-kv-router@1.1.0 | v1.82 | |
dynamo-kv-router@1.0.2 | v1.82 | |
dynamo-kv-router@1.0.1 | v1.82 | |
dynamo-kv-router@1.0.0 | v1.82 | Первый выпуск |
kvbm-logical (crate)
| Crate | MSRV (Rust) | Примечания |
|---|---|---|
kvbm-logical@1.2.0 | v1.82 | Первый выпуск |
Pre-Release Artifacts
Pre-Release artifacts не проходят QA validation. Pre-release версии — это experimental previews для раннего тестирования и обратной связи. Они могут содержать ошибки, breaking changes или незавершенные возможности. Для production workloads используйте стабильные релизы.
Предрелизные Python wheels публикуются в NVIDIA package index на pypi.nvidia.com, а не в публичном index PyPI. Как и стабильные wheels, это Linux (manylinux) builds для версий Python из Support Matrix; pip/uv на macOS или Windows не найдут подходящие wheels. Устанавливайте их на поддерживаемом Linux host или внутри Linux container.
Устанавливайте их, добавив этот URL как extra index и разрешив pre-releases (dev-версии PEP 440):
# uv (рекомендуется в других документах Dynamo)
uv pip install --pre --extra-index-url https://pypi.nvidia.com/ ai-dynamo==1.1.0.dev2
# pip
pip install --pre --extra-index-url https://pypi.nvidia.com ai-dynamo==1.1.0.dev2
GitHub tag или container tag v1.1.0-dev.N соответствует wheel-версии 1.1.0.devN (например, v1.1.0-dev.2 → ==1.1.0.dev2). Optional extras, такие как ai-dynamo[vllm], используют те же флаги; зафиксируйте нужную версию из разделов ниже.
v1.2.0-deepseek-v4-dev.3
- Branch: release/1.2.0-deepseek-v4-dev.3
- GitHub Tag: v1.2.0-deepseek-v4-dev.3
- Backends: vLLM
v0.20.1(DSv4 stabilization patch overv0.20.0native DSv4 support) | SGLang upstreamlmsysorg/sglang:deepseek-v4-blackwellpreview (refreshed for dev.3) | NIXLv0.10.1 - Coverage: Частично -- только DeepSeek-V4-Flash и V4-Pro. Для Blackwell (B200 и GB200) публикуются containers vLLM и SGLang; нет container TensorRT-LLM, нет других component containers, нет Helm charts, нет wheels. Snapshot dev build для раннего доступа к поддержке V4 model; без QA-gate.
Образы контейнеров
| Image:Tag | Backend | CUDA | Arch |
|---|---|---|---|
vllm-runtime:1.2.0-deepseek-v4-cuda13-dev.3 | vLLM v0.20.1 | v13.0 | AMD64/ARM64 |
sglang-runtime:1.2.0-deepseek-v4-cuda12-dev.3 | SGLang upstream DSv4 preview | v12.9 | AMD64 |
sglang-runtime:1.2.0-deepseek-v4-cuda13-dev.3 | SGLang upstream DSv4 preview | v13.0 | ARM64 |
Python wheels
Для этого dev release не публикуются. Используйте wheels v1.1.1 или v1.1.0-dev.3 с pypi.nvidia.com.
Helm charts
Для этого dev release не публикуются. Для установки платформы используйте charts v1.1.1.
Rust crates
Для pre-release версий не поставляются.
v1.2.0-deepseek-v4-dev.2
- Branch: release/1.2.0-deepseek-v4-dev.2
- GitHub Tag: v1.2.0-deepseek-v4-dev.2
- Backends: vLLM
v0.20.0(native DeepSeek-V4 support) | SGLang upstreamlmsysorg/sglang:deepseek-v4-blackwellpreview | NIXLv0.10.1 - Coverage: Только DeepSeek-V4-Flash и V4-Pro. Для Blackwell публикуются containers vLLM и SGLang. Container TensorRT-LLM, другие component containers, Helm charts и wheels для этого тега не публикуются. Snapshot dev build для раннего доступа к поддержке V4 model; без QA-gate.
Образы контейнеров
| Image:Tag | Backend | CUDA | Arch |
|---|---|---|---|
vllm-runtime:1.2.0-deepseek-v4-cuda13-dev.2 | vLLM v0.20.0 | v13.0 | AMD64/ARM64 |
sglang-runtime:1.2.0-deepseek-v4-cuda12-dev.2 | SGLang upstream DSv4 preview | v12.9 | AMD64 |
sglang-runtime:1.2.0-deepseek-v4-cuda13-dev.2 | SGLang upstream DSv4 preview | v13.0 | ARM64 |
Python wheels
Для этого dev release не публикуются. Используйте wheels v1.1.0 или v1.1.0-dev.3 с pypi.nvidia.com.
Helm charts
Для этого dev release не публикуются. Для установки платформы используйте charts v1.1.0.
Rust crates
Для pre-release версий не поставляются.
v1.1.0-dev.3
- Branch: release/1.1.0-dev.3
- GitHub Tag: v1.1.0-dev.3
- Backends (branch ToT): SGLang
v0.5.10.post1| TensorRT-LLMv1.3.0rc11| vLLMv0.19.0| NIXLv0.10.1 - Coverage: Runtime container TensorRT-LLM плюс
ai-dynamoиai-dynamo-runtimewheels на pypi.nvidia.com. Containers SGLang и vLLM, component containers (dynamo-frontend,dynamo-planner,kubernetes-operator,snapshot-agent), wheelkvbmи Helm charts для этого тега не публикуются.
Образы контейнеров
| Image:Tag | Backend | CUDA | Arch |
|---|---|---|---|
tensorrtllm-runtime:1.1.0-dev.3 | TRT-LLM v1.3.0rc11 | v13.1 | AMD64/ARM64 |
Python wheels
Доступны в pypi.nvidia.com (pre-release index):
uv pip install --pre --extra-index-url https://pypi.nvidia.com/ ai-dynamo==1.1.0.dev3
uv pip install --pre --extra-index-url https://pypi.nvidia.com/ ai-dynamo-runtime==1.1.0.dev3
kvbm==1.1.0.dev3 is not yet published.
Helm charts
Для этого dev release не публикуются. Для установки платформы используйте latest stable (v1.1.0).
Rust crates
Для pre-release версий не поставляются.
v1.1.0-dev.2
- Branch: release/1.1.0-dev.2
- GitHub Tag: v1.1.0-dev.2
- Backends (branch ToT): SGLang
v0.5.9| TensorRT-LLMv1.3.0rc9| vLLMv0.19.0| NIXLv0.10.1 - Coverage: Runtime containers SGLang и TensorRT-LLM плюс
ai-dynamoиai-dynamo-runtimewheels на pypi.nvidia.com. Runtime container vLLM, component containers (dynamo-frontend,dynamo-planner,kubernetes-operator,snapshot-agent), wheelkvbmи Helm charts для этого тега не публикуются.
Образы контейнеров
| Image:Tag | Backend | CUDA | Arch |
|---|---|---|---|
sglang-runtime:1.1.0-dev.2 | SGLang v0.5.9 | v12.9 | AMD64/ARM64 |
tensorrtllm-runtime:1.1.0-dev.2 | TRT-LLM v1.3.0rc9 | v13.1 | AMD64/ARM64 |
Python wheels
Доступны в pypi.nvidia.com (pre-release index):
uv pip install --pre --extra-index-url https://pypi.nvidia.com/ ai-dynamo==1.1.0.dev2
uv pip install --pre --extra-index-url https://pypi.nvidia.com/ ai-dynamo-runtime==1.1.0.dev2
Helm charts
Для этого dev release не публикуются. Для установки платформы используйте latest stable (v1.1.0).
Rust crates
Для pre-release версий не поставляются.
v1.1.0-dev.1
- Branch: release/1.1.0-dev.1
- GitHub Tag: v1.1.0-dev.1
- Backends: SGLang
v0.5.9| TensorRT-LLMv1.3.0rc5.post1| vLLMv0.17.1| NIXLv0.10.1
Образы контейнеров
| Image:Tag | Backend | CUDA | Arch |
|---|---|---|---|
vllm-runtime:1.1.0-dev.1 | vLLM v0.17.1 | v12.9 | AMD64/ARM64 |
vllm-runtime:1.1.0-dev.1-cuda13 | vLLM v0.17.1 | v13.0 | AMD64/ARM64 |
vllm-runtime:1.1.0-dev.1-efa-amd64 | vLLM v0.17.1 | v12.9 | AMD64 |
sglang-runtime:1.1.0-dev.1 | SGLang v0.5.9 | v12.9 | AMD64/ARM64 |
sglang-runtime:1.1.0-dev.1-cuda13 | SGLang v0.5.9 | v13.0 | AMD64/ARM64 |
tensorrtllm-runtime:1.1.0-dev.1 | TRT-LLM v1.3.0rc5.post1 | v13.1 | AMD64/ARM64 |
tensorrtllm-runtime:1.1.0-dev.1-efa-amd64 | TRT-LLM v1.3.0rc5.post1 | v13.1 | AMD64 |
dynamo-frontend:1.1.0-dev.1 | — | — | AMD64/ARM64 |
kubernetes-operator:1.1.0-dev.1 | — | — | AMD64/ARM64 |
snapshot-agent:1.1.0-dev.1 | — | — | AMD64/ARM64 |
Python wheels
Доступны в pypi.nvidia.com (pre-release index):
uv pip install --pre --extra-index-url https://pypi.nvidia.com/ ai-dynamo==1.1.0.dev1
uv pip install --pre --extra-index-url https://pypi.nvidia.com/ ai-dynamo-runtime==1.1.0.dev1
Helm charts
| Chart | NGC |
|---|---|
dynamo-platform-1.1.0-dev.1 | NGC Helm: dynamo-platform 1.1.0-dev.1 |
snapshot-1.1.0-dev.1 | NGC Helm: snapshot 1.1.0-dev.1 |
Rust crates
Для pre-release версий не поставляются.