TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-01-13 22:18:36 +08:00

History

Robin Kobus 4cd8543d8c [TRTLLM-1316] refactor: Remove unnecessary pipeline parallelism logic from postProcessRequest (#5489 ) Signed-off-by: Robin Kobus <19427718+Funatiq@users.noreply.github.com>		2025-07-02 10:13:31 +02:00
..
build_chatglm_engines.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
build_eagle_engines.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
build_enc_dec_engines.py	move the reset models into `examples/models/core` directory (#3555 )	2025-04-19 20:48:59 -07:00
build_engines_utils.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
build_gpt_engines.py	[TRTLLM-5171] chore: Remove GptSession/V1 from TRT workflow (#4092 )	2025-05-14 23:10:04 +02:00
build_gptj_engines.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
build_llama_engines.py	[TRTLLM-1316] refactor: Remove unnecessary pipeline parallelism logic from postProcessRequest (#5489 )	2025-07-02 10:13:31 +02:00
build_mamba_engines.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
build_medusa_engines.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
build_recurrentgemma_engines.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
build_redrafter_engines.py	ReDrafter support for Qwen (#4875 )	2025-06-28 02:33:10 +08:00
generate_expected_chatglm_output.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
generate_expected_eagle_output.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
generate_expected_enc_dec_output.py	move the reset models into `examples/models/core` directory (#3555 )	2025-04-19 20:48:59 -07:00
generate_expected_gpt_output.py	[TRTLLM-1316] refactor: Remove unnecessary pipeline parallelism logic from postProcessRequest (#5489 )	2025-07-02 10:13:31 +02:00
generate_expected_gptj_output.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
generate_expected_llama_output.py	[TRTLLM-1316] refactor: Remove unnecessary pipeline parallelism logic from postProcessRequest (#5489 )	2025-07-02 10:13:31 +02:00
generate_expected_mamba_output.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
generate_expected_medusa_output.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
generate_expected_recurrentgemma_output.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
generate_expected_redrafter_output.py	refactor: Move ModelSpec to core library (#3980 )	2025-05-04 01:39:09 +08:00
generate_hf_gpt_output.py	Update TensorRT-LLM (#787 )	2024-01-02 17:54:32 +08:00
generate_test_lora_weights.py	Update TensorRT-LLM (#2792 )	2025-02-18 21:27:39 +08:00
io_converter.py	Update TensorRT-LLM (#787 )	2024-01-02 17:54:32 +08:00