TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-01-24 04:33:04 +08:00

History

Yan Chunwei 0c26059703 chore: Cleanup deprecated APIs from LLM-API (part 1/2) (#3732 ) * beam_width and max_new_token Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> * remove beam_width Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> * remove min_length Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> * remove return_num_sequences Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com> --------- Signed-off-by: Superjomn <328693+Superjomn@users.noreply.github.com>		2025-05-07 13:20:25 +08:00
..
batched_logits_processor.yaml	test: [TRTLLM-4334] Create 1.0 criteria scope from API stability references (#3069 )	2025-03-26 18:14:35 +08:00
calib_config.yaml	test: [TRTLLM-4334] Create 1.0 criteria scope from API stability references (#3069 )	2025-03-26 18:14:35 +08:00
completion_output.yaml	feat: Support Top-K logprobs and prompt_logprobs in LLMAPI (#3388 )	2025-05-01 12:47:14 -04:00
guided_decoding_params.yaml	test: [TRTLLM-4334] Create 1.0 criteria scope from API stability references (#3069 )	2025-03-26 18:14:35 +08:00
llm.yaml	[TRTLLM-3925, https://nvbugs/5245262 ] [fix] Normalize LLM.generate API (#3985 )	2025-05-07 11:06:23 +08:00
logits_processor.yaml	feat: LogitsProcessor in PyTorch backend (#3145 )	2025-05-01 14:15:30 -07:00
quant_config.yaml	feat: [Deepseek] Add trtllm-gen MOE FP4 MOE backend (#3387 )	2025-04-21 10:01:33 +08:00
request_output.yaml	feat: Support Top-K logprobs and prompt_logprobs in LLMAPI (#3388 )	2025-05-01 12:47:14 -04:00
sampling_params.yaml	chore: Cleanup deprecated APIs from LLM-API (part 1/2) (#3732 )	2025-05-07 13:20:25 +08:00