TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-01-14 06:27:45 +08:00

History

Shunkangz ea050084ad feat: Add support of chat completion in PD (#2985 ) * Add support of chat completion in PD Add support of include_usage in PD Reformat * Remove redundant code Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> * Refactor code Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> * Add chat completion test Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> * Refactor code Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> --------- Signed-off-by: Shunkang <182541032+Shunkangz@users.noreply.github.co> Co-authored-by: Shunkang <182541032+Shunkangz@users.noreply.github.co>		2025-04-11 17:53:28 +08:00
..
__init__.py	Update TensorRT-LLM (#2820 )	2025-02-25 21:21:49 +08:00
openai_disagg_server.py	feat: Add support of chat completion in PD (#2985 )	2025-04-11 17:53:28 +08:00
openai_protocol.py	feat: Add support of chat completion in PD (#2985 )	2025-04-11 17:53:28 +08:00
openai_server.py	feat: Add support of chat completion in PD (#2985 )	2025-04-11 17:53:28 +08:00
postprocess_handlers.py	feat: Add support of chat completion in PD (#2985 )	2025-04-11 17:53:28 +08:00