TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-02-05 02:31:33 +08:00

Author	SHA1	Message	Date
Anish Shanbhag	24ac86c485	[https://nvbugs/5761391 ][fix] Include triton-kernels as a packaged dependency (#10471 ) Signed-off-by: Anish Shanbhag <ashanbhag@nvidia.com>	2026-01-28 19:56:32 -08:00
Wanli Jiang	4a206351bb	[TRTLLM-10453][feat] Update mamba decode kernel to flashinfer (#10757 ) Signed-off-by: Wanli Jiang <35160485+Wanli-Jiang@users.noreply.github.com>	2026-01-27 13:04:40 +08:00
Shi Xiaowei	9adef4eb28	[TRTLLM-9527][doc] Add NIXL as a Python attribution (step 4) (#10910 ) Signed-off-by: Shixiaowei02 <39303645+Shixiaowei02@users.noreply.github.com>	2026-01-22 10:09:55 -08:00
Yihan Wang	cdb9ffd0ab	[https://nvbugs/5741304 ][chore] Update flashinfer-python to 0.6.1 (#10872 ) Signed-off-by: Yihan Wang	2026-01-22 19:29:16 +08:00
Chenghao Zhang	0b748d5bba	[None][chore] update flashinfer to 0.6.0 (#10522 ) Signed-off-by: Chenghao Zhang <211069071+nvchenghaoz@users.noreply.github.com>	2026-01-16 16:22:06 -05:00
zhanghaotong	36c9e7cfe6	[None][chore] Add unittest for otlp tracing (#8716 ) Signed-off-by: zhanghaotong <zhanghaotong.zht@antgroup.com> Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co>	2025-12-09 18:34:08 -08:00
Chenjie Luo	d252101a76	[OMNIML-3036][doc] Re-branding TensorRT-Model-Optimizer as Nvidia Model-Optimizer (#9679 ) Signed-off-by: Chenjie Luo <chenjiel@nvidia.com>	2025-12-07 07:14:05 -08:00
Li Min	1797e91dfd	[TRTLLM-6222][feat] Extend cute_dsl_nvfp4_gemm to sm103. (#9543 ) Signed-off-by: Mindy Li <11663212+limin2021@users.noreply.github.com>	2025-12-01 10:19:36 +08:00
Enwei Zhu	1bf2d750a2	[None][chore] Upgrade CuteDSL to 4.3.0 (#9444 ) Signed-off-by: Enwei Zhu <21126786+syuoni@users.noreply.github.com>	2025-11-26 14:53:09 +08:00
Venky	8d07580c95	[None] [chore] Add ATTRIBUTIONS-{CPP,Python}.md + Update in wheels setup (#8438 ) Signed-off-by: Venky Ganesh <23023424+venkywonka@users.noreply.github.com>	2025-10-17 06:33:05 -07:00

10 Commits