diff --git a/latest/.buildinfo b/latest/.buildinfo index d02654bf0d..3d8a1f8e70 100644 --- a/latest/.buildinfo +++ b/latest/.buildinfo @@ -1,4 +1,4 @@ # Sphinx build info version 1 # This file hashes the configuration used when building these files. When it is not found, a full rebuild will be done. -config: 05441684cb2c0903bdac9ebb5abe267d +config: eb18464cd19c763f9cb542fdd6f60977 tags: 645f666f9bcd5a90fca523b33c5a78b7 diff --git a/latest/_cpp_gen/executor.html b/latest/_cpp_gen/executor.html index 87eb7fb4c0..2a119ff57e 100644 --- a/latest/_cpp_gen/executor.html +++ b/latest/_cpp_gen/executor.html @@ -59,7 +59,7 @@ @@ -69,7 +69,7 @@ - + @@ -335,6 +335,7 @@
  • Generate text with guided decoding
  • Control generated text using logits processor
  • Generate text with multiple LoRA adapters
  • +
  • Sparse Attention
  • Speculative Decoding
  • KV Cache Connector
  • KV Cache Offloading
  • @@ -365,6 +366,7 @@
  • Quick Start Recipe for Llama3.3 70B on TensorRT LLM - Blackwell & Hopper Hardware
  • Quick Start Recipe for Llama4 Scout 17B on TensorRT LLM - Blackwell & Hopper Hardware
  • Quick Start Recipe for GPT-OSS on TensorRT-LLM - Blackwell Hardware
  • +
  • Quick Start Recipe for Qwen3 Next on TensorRT LLM - Blackwell & Hopper Hardware
  • @@ -407,6 +409,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -407,6 +409,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -402,6 +404,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -407,6 +409,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -407,6 +409,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -411,6 +413,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -411,6 +413,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -411,6 +413,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -411,6 +413,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -411,6 +413,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -407,6 +409,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -405,6 +407,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -405,6 +407,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide

    @@ -636,9 +641,9 @@ diff --git a/latest/deployment-guide/quick-start-recipe-for-deepseek-r1-on-trtllm.html b/latest/deployment-guide/quick-start-recipe-for-deepseek-r1-on-trtllm.html index ec286e47fa..c36acd4426 100644 --- a/latest/deployment-guide/quick-start-recipe-for-deepseek-r1-on-trtllm.html +++ b/latest/deployment-guide/quick-start-recipe-for-deepseek-r1-on-trtllm.html @@ -59,7 +59,7 @@ @@ -71,7 +71,7 @@ - + @@ -337,6 +337,7 @@
  • Generate text with guided decoding
  • Control generated text using logits processor
  • Generate text with multiple LoRA adapters
  • +
  • Sparse Attention
  • Speculative Decoding
  • KV Cache Connector
  • KV Cache Offloading
  • @@ -367,6 +368,7 @@
  • Quick Start Recipe for Llama3.3 70B on TensorRT LLM - Blackwell & Hopper Hardware
  • Quick Start Recipe for Llama4 Scout 17B on TensorRT LLM - Blackwell & Hopper Hardware
  • Quick Start Recipe for GPT-OSS on TensorRT-LLM - Blackwell Hardware
  • +
  • Quick Start Recipe for Qwen3 Next on TensorRT LLM - Blackwell & Hopper Hardware
  • @@ -409,6 +411,7 @@
  • Speculative Decoding
  • Checkpoint Loading
  • AutoDeploy (Prototype)
  • +
  • Ray Orchestrator (Prototype)
  • Developer Guide