TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-01-26 13:43:38 +08:00

History

dominicshanshan 6345074686 [None][chore] Weekly mass integration of release/1.1 -- rebase (#9522 ) Signed-off-by: yunruis <205571022+yunruis@users.noreply.github.com> Signed-off-by: Mike Iovine <6158008+mikeiovine@users.noreply.github.com> Signed-off-by: Mike Iovine <miovine@nvidia.com> Signed-off-by: Wangshanshan <30051912+dominicshanshan@users.noreply.github.com> Signed-off-by: qgai <qgai@nvidia.com> Signed-off-by: Balaram Buddharaju <169953907+brb-nv@users.noreply.github.com> Signed-off-by: Yan Chunwei <328693+Superjomn@users.noreply.github.com> Signed-off-by: Junyi Xu <219237550+JunyiXu-nv@users.noreply.github.com> Signed-off-by: Simeng Liu <simengl@nvidia.com> Signed-off-by: nv-guomingz <137257613+nv-guomingz@users.noreply.github.com> Signed-off-by: Jin Li <59594262+liji-nv@users.noreply.github.com> Signed-off-by: Ivy Zhang <25222398+crazydemo@users.noreply.github.com> Signed-off-by: Vincent Zhang <vinczhang@nvidia.com> Signed-off-by: peaceh <103117813+peaceh-nv@users.noreply.github.com> Signed-off-by: Michal Guzek <mguzek@nvidia.com> Signed-off-by: Michal Guzek <moraxu@users.noreply.github.com> Signed-off-by: Chang Liu (Enterprise Products) <9713593+chang-l@users.noreply.github.com> Signed-off-by: leslie-fang25 <leslief@nvidia.com> Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> Signed-off-by: junq <22017000+QiJune@users.noreply.github.com> Co-authored-by: yunruis <205571022+yunruis@users.noreply.github.com> Co-authored-by: sunnyqgg <159101675+sunnyqgg@users.noreply.github.com> Co-authored-by: brb-nv <169953907+brb-nv@users.noreply.github.com> Co-authored-by: Yan Chunwei <328693+Superjomn@users.noreply.github.com> Co-authored-by: JunyiXu-nv <219237550+JunyiXu-nv@users.noreply.github.com> Co-authored-by: Simeng Liu <109828133+SimengLiu-nv@users.noreply.github.com> Co-authored-by: Guoming Zhang <137257613+nv-guomingz@users.noreply.github.com> Co-authored-by: Jin Li <59594262+liji-nv@users.noreply.github.com> Co-authored-by: Ivy Zhang <25222398+crazydemo@users.noreply.github.com> Co-authored-by: Vincent Zhang <vcheungyi@163.com> Co-authored-by: peaceh-nv <103117813+peaceh-nv@users.noreply.github.com> Co-authored-by: Michal Guzek <moraxu@users.noreply.github.com> Co-authored-by: Chang Liu <9713593+chang-l@users.noreply.github.com> Co-authored-by: Leslie Fang <leslief@nvidia.com> Co-authored-by: Shunkangz <182541032+Shunkangz@users.noreply.github.com> Co-authored-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> Co-authored-by: QI JUN <22017000+QiJune@users.noreply.github.com>		2025-11-29 21:48:48 +08:00
..
blog1_Pushing_Latency_Boundaries_Optimizing_DeepSeek-R1_Performance_on_NVIDIA_B200_GPUs.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog2_DeepSeek_R1_MTP_Implementation_and_Optimization.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog3_Optimizing_DeepSeek_R1_Throughput_on_NVIDIA_Blackwell_GPUs.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog4_Scaling_Expert_Parallelism_in_TensorRT-LLM.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog5_Disaggregated_Serving_in_TensorRT-LLM.md	[None][chore] Weekly mass integration of release/1.1 -- rebase (#9522 )	2025-11-29 21:48:48 +08:00
blog6_Llama4_maverick_eagle_guide.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog7_NGram_performance_Analysis_And_Auto_Enablement.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog8_Scaling_Expert_Parallelism_in_TensorRT-LLM_part2.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog9_Deploying_GPT_OSS_on_TRTLLM.md	[None][doc] Rename TensorRT-LLM to TensorRT LLM. (#7554 )	2025-09-09 12:16:03 +08:00
blog10_ADP_Balance_Strategy.md	[None][doc] Paragraph adjustment and fix statistic (#8568 )	2025-10-22 03:26:09 -04:00
blog11_GPT_OSS_Eagle3.md	[None][doc] Update kvcache part (#7549 )	2025-09-09 12:16:03 +08:00
blog12_Combining_Guided_Decoding_and_Speculative_Decoding.md	[None][doc] Update tech blog12 (#7884 )	2025-09-20 18:15:39 +08:00
blog13_Inference_Time_Compute_Implementation_in_TensorRT-LLM.md	[None][doc] Scaffolding tech blog fix a typo (#8042 )	2025-09-28 10:29:01 -04:00
blog14_Scaling_Expert_Parallelism_in_TensorRT-LLM_part3.md	[None] [blog] Scaling Expert Parallelism in TensorRT LLM (Part 3: Pushing the Performance Boundary) (#8323 )	2025-10-13 06:37:17 -07:00