TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-02-01 08:41:13 +08:00

History

dominicshanshan 6345074686 [None][chore] Weekly mass integration of release/1.1 -- rebase (#9522 ) Signed-off-by: yunruis <205571022+yunruis@users.noreply.github.com> Signed-off-by: Mike Iovine <6158008+mikeiovine@users.noreply.github.com> Signed-off-by: Mike Iovine <miovine@nvidia.com> Signed-off-by: Wangshanshan <30051912+dominicshanshan@users.noreply.github.com> Signed-off-by: qgai <qgai@nvidia.com> Signed-off-by: Balaram Buddharaju <169953907+brb-nv@users.noreply.github.com> Signed-off-by: Yan Chunwei <328693+Superjomn@users.noreply.github.com> Signed-off-by: Junyi Xu <219237550+JunyiXu-nv@users.noreply.github.com> Signed-off-by: Simeng Liu <simengl@nvidia.com> Signed-off-by: nv-guomingz <137257613+nv-guomingz@users.noreply.github.com> Signed-off-by: Jin Li <59594262+liji-nv@users.noreply.github.com> Signed-off-by: Ivy Zhang <25222398+crazydemo@users.noreply.github.com> Signed-off-by: Vincent Zhang <vinczhang@nvidia.com> Signed-off-by: peaceh <103117813+peaceh-nv@users.noreply.github.com> Signed-off-by: Michal Guzek <mguzek@nvidia.com> Signed-off-by: Michal Guzek <moraxu@users.noreply.github.com> Signed-off-by: Chang Liu (Enterprise Products) <9713593+chang-l@users.noreply.github.com> Signed-off-by: leslie-fang25 <leslief@nvidia.com> Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> Signed-off-by: junq <22017000+QiJune@users.noreply.github.com> Co-authored-by: yunruis <205571022+yunruis@users.noreply.github.com> Co-authored-by: sunnyqgg <159101675+sunnyqgg@users.noreply.github.com> Co-authored-by: brb-nv <169953907+brb-nv@users.noreply.github.com> Co-authored-by: Yan Chunwei <328693+Superjomn@users.noreply.github.com> Co-authored-by: JunyiXu-nv <219237550+JunyiXu-nv@users.noreply.github.com> Co-authored-by: Simeng Liu <109828133+SimengLiu-nv@users.noreply.github.com> Co-authored-by: Guoming Zhang <137257613+nv-guomingz@users.noreply.github.com> Co-authored-by: Jin Li <59594262+liji-nv@users.noreply.github.com> Co-authored-by: Ivy Zhang <25222398+crazydemo@users.noreply.github.com> Co-authored-by: Vincent Zhang <vcheungyi@163.com> Co-authored-by: peaceh-nv <103117813+peaceh-nv@users.noreply.github.com> Co-authored-by: Michal Guzek <moraxu@users.noreply.github.com> Co-authored-by: Chang Liu <9713593+chang-l@users.noreply.github.com> Co-authored-by: Leslie Fang <leslief@nvidia.com> Co-authored-by: Shunkangz <182541032+Shunkangz@users.noreply.github.com> Co-authored-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> Co-authored-by: QI JUN <22017000+QiJune@users.noreply.github.com>		2025-11-29 21:48:48 +08:00
..
auto_deploy	[#9150 ][feat] AutoDeploy Nemotron-Flash support (#9504 )	2025-11-27 18:03:57 +01:00
additional-outputs.md	[TRTLLM-7159][docs] Add documentation for additional outputs (#8325 )	2025-10-27 09:52:04 +01:00
attention.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
checkpoint-loading.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
disagg-serving.md	[None][chore] Weekly mass integration of release/1.1 -- rebase (#9522 )	2025-11-29 21:48:48 +08:00
feature-combination-matrix.md	[None][chore] Update feature combination matrix for SWA kv cache reuse (#8529 )	2025-10-21 04:41:44 -04:00
kvcache.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM for homepage and the … (#7850 )	2025-09-25 21:02:35 +08:00
long-sequence.md	[None][doc] Add the missing content for model support section and fix valid links for long_sequence.md (#8869 )	2025-11-03 02:06:04 -08:00
lora.md	[TRTLLM-5930][doc] 1.0 Documentation. (#6696 )	2025-09-09 12:16:03 +08:00
multi-modality.md	[None][fix] add missing CLI option in multimodal example (#8977 )	2025-11-07 09:06:08 +01:00
overlap-scheduler.md	[TRTLLM-5930][doc] 1.0 Documentation. (#6696 )	2025-09-09 12:16:03 +08:00
paged-attention-ifb-scheduler.md	[None][doc] Use hash id for external link (#7641 )	2025-09-22 14:28:38 +08:00
parallel-strategy.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
quantization.md	[None][doc] Fix a invalid link and a typo. (#7634 )	2025-09-22 14:28:38 +08:00
ray-orchestrator.md	[None][doc] Ray orchestrator initial doc (#8373 )	2025-10-14 21:17:57 -07:00
sampling.md	[None][doc] Use hash id for external link (#7641 )	2025-09-22 14:28:38 +08:00
speculative-decoding.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
torch_compile_and_piecewise_cuda_graph.md	[None][doc] Add doc for torch.compile & piecewise cuda graph (#8527 )	2025-10-29 21:15:46 -07:00