TensorRT-LLMs/__init__.py at db4edea1e1359bcfcac7bbb87c1b639b5611c721 - TensorRT-LLMs - Gitea: Git with a cup of tea

kanshan/TensorRT-LLMs

mirror of https://github.com/NVIDIA/TensorRT-LLM.git synced 2026-02-09 04:31:49 +08:00

Kaiyu Xie db4edea1e1

Update TensorRT-LLM (#1763 )

* Update TensorRT-LLM

---------

Co-authored-by: Kota Tsuyuzaki <bloodeagle40234@gmail.com>
Co-authored-by: Pzzzzz <hello-cd.plus@hotmail.com>
Co-authored-by: Patrick Reiter Horn <patrick.horn@gmail.com>

2024-06-11 16:59:02 +08:00

9 lines

344 B

Python

Raw Blame History

 from .llm import (LLM, CapacitySchedulerPolicy, KvCacheConfig, ModelConfig,
                   ParallelConfig, SamplingParams, StreamingLLMParam)
 from .tokenizer import TokenizerBase
 __all__ = [
     'LLM', 'ModelConfig', 'TokenizerBase', 'SamplingParams', 'ParallelConfig',
     'StreamingLLMParam', 'KvCacheConfig', 'CapacitySchedulerPolicy'
 ]