[https://nvbugs/5772521][fix] Fix draft token tree chain crash (#10386)

Signed-off-by: Mike Iovine <6158008+mikeiovine@users.noreply.github.com>
2026-01-13 22:18:36 +08:00 · 2026-01-05 11:18:44 -05:00 · 2026-01-05 11:18:44 -05:00 · bedfff4f00
commit bedfff4f00
parent e98c27ee4f
1 changed files with 3 additions and 4 deletions
--- a/tensorrt_llm/_torch/pyexecutor/sampler.py
+++ b/tensorrt_llm/_torch/pyexecutor/sampler.py
@ -1298,14 +1298,13 @@ class TorchSampler(Sampler, AsyncWorkerMixin):
        # Take the longest accepted path as the next new token.
        num_accepted_draft_tokens = 0
        for idx in eagle_paths[longest_match_path_idx][:longest_accepted_len]:
-            add_token(
-                request, new_tokens_list, beam_idx=DEFAULT_BEAM_IDX, step=cast(int, idx.item())
-            )
+            step = cast(int, idx.item())
+            add_token(request, new_tokens_list, beam_idx=DEFAULT_BEAM_IDX, step=step)
            num_accepted_draft_tokens += 1
            if self.finish_if_reason(
                request,
                finish_reasons,
-                step=num_accepted_draft_tokens,
+                step=step,
                beam_idx=DEFAULT_BEAM_IDX,
            ):
                break