TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-02-04 18:21:52 +08:00

History

Jiayu Chang 1dc49b266e [https://nvbugs/5322131 ][feat] Multi-LoRA serving with CUDA Graph (#8279 ) Signed-off-by: Jiayu Chang <jiayuc@nvidia.com>		2026-01-22 14:01:18 +01:00
..
dora.cpp	Update TensorRT-LLM (#2755 )	2025-02-11 03:01:00 +00:00
dora.h	[None][fix] Introduce inline namespace to avoid symbol collision (#9541 )	2025-12-12 23:32:15 +08:00
lora.cpp	[https://nvbugs/5322131 ][feat] Multi-LoRA serving with CUDA Graph (#8279 )	2026-01-22 14:01:18 +01:00
lora.h	[None][fix] Introduce inline namespace to avoid symbol collision (#9541 )	2025-12-12 23:32:15 +08:00
loraGroupGEMMParamFillRowReorderFusion.cu	[https://nvbugs/5322131 ][feat] Multi-LoRA serving with CUDA Graph (#8279 )	2026-01-22 14:01:18 +01:00
loraGroupGEMMParamFillRowReorderFusion.h	[https://nvbugs/5322131 ][feat] Multi-LoRA serving with CUDA Graph (#8279 )	2026-01-22 14:01:18 +01:00