feat: Make benchmark_serving part of the library (#5428)

Signed-off-by: Kaiyu Xie <26294424+kaiyux@users.noreply.github.com>
2026-01-14 06:27:45 +08:00 · 2025-06-25 23:13:56 +08:00 · 2025-06-25 23:13:56 +08:00 · c5ae3272b9
commit c5ae3272b9
parent 314f15f0a7
3 changed files with 12 additions and 10 deletions
--- a/tensorrt_llm/serve/scripts/init.py
+++ b/tensorrt_llm/serve/scripts/init.py
--- a/tensorrt_llm/serve/scripts/benchmark_dataset.py
+++ b/tensorrt_llm/serve/scripts/benchmark_dataset.py
@ -26,10 +26,11 @@ from typing import Any, Callable, Optional, Union

 import numpy as np
 import pandas as pd
-from benchmark_utils import download_and_cache_file
 from datasets import load_dataset
 from transformers import PreTrainedTokenizerBase

+from .benchmark_utils import download_and_cache_file
+
 logger = logging.getLogger(__name__)

 # -----------------------------------------------------------------------------
--- a/tensorrt_llm/serve/scripts/benchmark_serving.py
+++ b/tensorrt_llm/serve/scripts/benchmark_serving.py
@ -31,18 +31,19 @@ from datetime import datetime
 from typing import Any, Optional

 import numpy as np
-from backend_request_func import (ASYNC_REQUEST_FUNCS,
-                                  OPENAI_COMPATIBLE_BACKENDS, RequestFuncInput,
-                                  RequestFuncOutput, get_tokenizer)
-from benchmark_dataset import (AIMODataset, BurstGPTDataset,
-                               ConversationDataset, HuggingFaceDataset,
-                               InstructCoderDataset, RandomDataset,
-                               SampleRequest, ShareGPTDataset, SonnetDataset,
-                               VisionArenaDataset)
-from benchmark_utils import convert_to_pytorch_benchmark_format, write_to_json
 from tqdm.asyncio import tqdm
 from transformers import PreTrainedTokenizerBase

+from .backend_request_func import (ASYNC_REQUEST_FUNCS,
+                                   OPENAI_COMPATIBLE_BACKENDS, RequestFuncInput,
+                                   RequestFuncOutput, get_tokenizer)
+from .benchmark_dataset import (AIMODataset, BurstGPTDataset,
+                                ConversationDataset, HuggingFaceDataset,
+                                InstructCoderDataset, RandomDataset,
+                                SampleRequest, ShareGPTDataset, SonnetDataset,
+                                VisionArenaDataset)
+from .benchmark_utils import convert_to_pytorch_benchmark_format, write_to_json
+
 MILLISECONDS_TO_SECONDS_CONVERSION = 1000