TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-01-14 06:27:45 +08:00

History

Kaiyu Xie 3c0462002c TensorRT-LLM v0.18 release (#3231 )		2025-04-02 17:01:16 +08:00
..
compilation	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
modeling	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
multi_gpu	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
thop	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
helpers.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
pattern_watcher.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_attention.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_flashinfer_attention.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_flashinfer_star_attn.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_fp4_gemm_quantize.py	TensorRT-LLM v0.18 release (#3231 )	2025-04-02 17:01:16 +08:00
test_fp4_linear.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_fp8_linear.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_fused_moe.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_pytorch_model_engine.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_scaled_mm.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00
test_vanilla_attention.py	open source 09df54c0cc99354a60bbc0303e3e8ea33a96bef0 (#2725 )	2025-02-11 02:21:51 +00:00