TensorRT-LLMs/examples/disaggregated/slurm/benchmark/start_server.sh

#!/bin/bash
set -u
set -e
set -x

num_ctx_servers=$1
num_gen_servers=$2
work_dir=$3
script_dir=$4

python3 ${script_dir}/gen_server_config.py \
    --num_ctx_servers ${num_ctx_servers} \
    --num_gen_servers ${num_gen_servers} \
    --work_dir ${work_dir}
echo "server config generated to ${work_dir}/server_config.yaml"

trtllm-serve disaggregated -c ${work_dir}/server_config.yaml -t 7200 -r 7200