[None][fix] enable EPLB for DEEPGEMM

Signed-off-by: xxi <xxi@nvidia.com>
2026-01-13 22:18:36 +08:00 · 2026-01-13 03:26:50 +00:00 · 2026-01-13 03:26:50 +00:00 · 8d998af03b
commit 8d998af03b
parent ba1cb6831d
1 changed files with 3 additions and 2 deletions
--- a/tensorrt_llm/_torch/modules/fused_moe/create_moe.py
+++ b/tensorrt_llm/_torch/modules/fused_moe/create_moe.py
@ -138,8 +138,9 @@ def create_moe_backend(
    moe_load_balancer = get_moe_load_balancer()
    if moe_load_balancer is not None:
        assert moe_cls in [
-            WideEPMoE, CutlassFusedMoE, TRTLLMGenFusedMoE, CuteDslFusedMoE
-        ], "MoE Load Balance is only supported in WideEPMoE, CutlassFusedMoE, TRTLLMGenFusedMoE and CuteDslFusedMoE now."
+            WideEPMoE, CutlassFusedMoE, TRTLLMGenFusedMoE, CuteDslFusedMoE,
+            DeepGemmFusedMoE
+        ], "MoE Load Balance is only supported in WideEPMoE, CutlassFusedMoE, TRTLLMGenFusedMoE and CuteDslFusedMoE, and DeepGemmFusedMoE."

    if bias:
        assert moe_cls in [CutlassFusedMoE, TritonFusedMoE, TRTLLMGenFusedMoE