TensorRT-LLMs

[https://nvbugs/5629887][fix] Add missing device count guard for DSv32 multiGPU tests (#9159)

auto-close-inactive-issues.yml #4743:Scheduled

main

2025-11-16 03:00:40 +08:00

0s

[None][fix] Fix KV cache manager test warnings (#9103)

auto-close-inactive-issues.yml #4742:Scheduled

main

2025-11-15 03:00:40 +08:00

0s

[TRTLLM-9175][test] ensure sampling is async (#9076)

auto-close-inactive-issues.yml #4741:Scheduled

main

2025-11-14 03:00:45 +08:00

0s

[None][fix] Display the GPU memory information in GiB unit. (#9070)

auto-close-inactive-issues.yml #4740:Scheduled

main

2025-11-13 03:00:43 +08:00

0s

[None][fix] Improve type annotations on ResourceManager.get_resource_manager (#9013)

auto-close-inactive-issues.yml #4739:Scheduled

main

2025-11-12 03:00:45 +08:00

0s

[None][infra] Waive failed tests for main 11/07 (#9008)

auto-close-inactive-issues.yml #4738:Scheduled

main

2025-11-11 03:00:47 +08:00

0s

[None][infra] Update allowed list 2025.11.06 (#8987)

auto-close-inactive-issues.yml #4737:Scheduled

main

2025-11-10 03:00:49 +08:00

0s

[https://nvbugs/5629790][chore] unwaive test. (#8967)

auto-close-inactive-issues.yml #4736:Scheduled

main

2025-11-09 03:00:49 +08:00

0s

[https://nvbugs/5630345] [chore] skip deepseek-v3.2 fp8 kv tests on pre-Blackwell architectures (#8973)

auto-close-inactive-issues.yml #4735:Scheduled

main

2025-11-08 03:00:46 +08:00

0s

[https://nvbugs/5630345][chore] unwaive DS-v32 nvfp4 and fp8 tests (#8887)

auto-close-inactive-issues.yml #4734:Scheduled

main

2025-11-07 03:00:44 +08:00

0s

[https://nvbugs/5596343] [test] Waive flaky GPT-OSS cases (#8904)

auto-close-inactive-issues.yml #4733:Scheduled

main

2025-11-06 03:00:47 +08:00

0s

[None][infra] Waive the failed test for main on 11/3 (#8875)

auto-close-inactive-issues.yml #4732:Scheduled

main

2025-11-05 03:00:45 +08:00

0s

[#8781][fix] Cache the AllReduce wrapper to avoid re-allocating workspace which caused a hang (#8803)

auto-close-inactive-issues.yml #4731:Scheduled

main

2025-11-04 03:00:45 +08:00

0s

[None][feat] Use ruff for formatting and linting new files by default (#8629)

auto-close-inactive-issues.yml #4730:Scheduled

main

2025-11-03 03:00:40 +08:00

0s

[https://nvbugs/5474119][fix] Re-enable test (#8809)

auto-close-inactive-issues.yml #4729:Scheduled

main

2025-11-02 03:00:40 +08:00

0s

[None][fix] Layer wise benchmarks: use local models, lint (#8799)

auto-close-inactive-issues.yml #4728:Scheduled

main

2025-11-01 03:00:40 +08:00

0s

[TRTLLM-8976][feat] Move indexer-k-cache to KVCacheManager (#8699)

auto-close-inactive-issues.yml #4727:Scheduled

main

2025-10-31 03:00:40 +08:00

0s

[None][fix] Properly raise error for nemotron H models (#8697)

auto-close-inactive-issues.yml #4726:Scheduled

main

2025-10-30 03:00:40 +08:00

0s

[TRTLLM-8832][feat] fully async _select_generated_logits with tests (#8628)

auto-close-inactive-issues.yml #4725:Scheduled

main

2025-10-29 03:00:42 +08:00

0s

[None][infra] Waive failed case on main 10/26 (#8668)

auto-close-inactive-issues.yml #4724:Scheduled

main

2025-10-28 03:00:44 +08:00

0s

[TRTLLM-8238][feat] Add EVS support for nano-v2-vlm (#8024)

auto-close-inactive-issues.yml #4723:Scheduled

main

2025-10-27 03:00:45 +08:00

0s

[None][feat] Pass KvCacheRetentionConfig to torch LlmRequest (#8634)

auto-close-inactive-issues.yml #4722:Scheduled

main

2025-10-26 03:00:45 +08:00

0s

[TRTLLM-8714][fix] update create_input_processor to handle custom checkpoint format (#7811)

auto-close-inactive-issues.yml #4721:Scheduled

main

2025-10-25 03:00:45 +08:00

0s

[None][fix] fixed cached model path in test (#8549)

auto-close-inactive-issues.yml #4720:Scheduled

main

2025-10-24 03:00:45 +08:00

0s

[None][doc] Facilitates the integration of the transfer agent (#7867)

auto-close-inactive-issues.yml #4719:Scheduled

main

2025-10-23 03:00:45 +08:00

0s

[https://nvbugs/5492250][fix] Remove isolated cases and unwaive cases (#8492)

auto-close-inactive-issues.yml #4718:Scheduled

main

2025-10-22 03:00:47 +08:00

0s

[TRTLLM-7964][infra] Set nixl to default cache transceiver backend (#7926)

auto-close-inactive-issues.yml #4717:Scheduled

main

2025-10-21 03:00:45 +08:00

0s

[None][feat] AutoDeploy: chunked prefill support (#8158)

auto-close-inactive-issues.yml #4716:Scheduled

main

2025-10-20 03:00:50 +08:00

0s

[TRTLLM-8201][feat] Topological graph helpers (#8457)

auto-close-inactive-issues.yml #4715:Scheduled

main

2025-10-19 03:00:43 +08:00

0s

[None][bug] Set NCCL_GRAPH_REGISTER to false to avoid hang (#8413)

auto-close-inactive-issues.yml #4714:Scheduled

main

2025-10-18 03:00:40 +08:00

0s