TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-01-14 06:27:45 +08:00

History

Dom Brown c45f414bbf Test: Improve model re-use in C++ DGX tests for CI stability (#4263 ) * Fix padded vocab size for Llama Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * Refactor multi GPU llama executor tests, and reuse the built model engines Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * Fix test list typo Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * WIP Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * Further WIP Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * WIP Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * Update test lists and readme Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * Try parametrize for asymmetric Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> * Parametrize + skip unsupported combinations Signed-off-by: domb <3886319+DomBrown@users.noreply.github.com> * Update test list Signed-off-by: domb <3886319+DomBrown@users.noreply.github.com> * Reduce environment duplicated code Signed-off-by: domb <3886319+DomBrown@users.noreply.github.com> --------- Signed-off-by: Dom Brown <3886319+DomBrown@users.noreply.github.com> Signed-off-by: domb <3886319+DomBrown@users.noreply.github.com>		2025-05-19 14:20:21 +01:00
..
cache_transmission	feat: NIXL interface integration (#3934 )	2025-05-19 18:18:22 +08:00
CMakeLists.txt	feat: NIXL interface integration (#3934 )	2025-05-19 18:18:22 +08:00
disaggExecutor.h	refactor: Introduce MpiTag enumeration and update MPI function signatures (#3893 )	2025-05-04 13:24:29 +02:00
disaggExecutorTest.cpp	Test: Improve model re-use in C++ DGX tests for CI stability (#4263 )	2025-05-19 14:20:21 +01:00
encDecTest.cpp	[TRTLLM-5171] chore: Remove GptSession/V1 from TRT workflow (#4092 )	2025-05-14 23:10:04 +02:00
executorMockTest.cpp	fix: request termination in pipeline parallelism (#3892 )	2025-05-05 21:51:41 +08:00
executorTest.cpp	[TRTLLM-5171] chore: Remove GptSession/V1 from TRT workflow (#4092 )	2025-05-14 23:10:04 +02:00
executorTest.h	Update TensorRT-LLM (#2873 )	2025-03-11 21:13:42 +08:00