TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-01-14 06:27:45 +08:00

History

qsang-nv 0fd59d64ab infra: open source fmha v2 kernels (#4185 ) * add fmha repo Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * fix format Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * fix code style Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * fix header Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * fix header kernel_traits.h Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * add .gitignore file Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * add SLIDING_WINDOW_ATTENTION Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * fix style Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * fix format Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * update setup.py Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> * update build_wheel.py Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> --------- Signed-off-by: Qidi Sang <200703406+qsang-nv@users.noreply.github.com> Signed-off-by: qsang-nv <200703406+qsang-nv@users.noreply.github.com>		2025-05-15 10:56:34 +08:00
..
fmha_dgrad_v2_fp16_128_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00
fmha_dgrad_v2_fp16_256_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00
fmha_dgrad_v2_fp16_384_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00
fmha_dgrad_v2_fp16_512_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00
fmha_fprop_v2_fp16_128_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00
fmha_fprop_v2_fp16_256_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00
fmha_fprop_v2_fp16_384_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00
fmha_fprop_v2_fp16_512_64_kernel.sm80.cu	infra: open source fmha v2 kernels (#4185 )	2025-05-15 10:56:34 +08:00