[None][chore] AutoDeploy: Set nanov3 and superv3 configs to use flashinfer ssm (#11183)

Signed-off-by: Gal Hubara Agam <96368689+galagam@users.noreply.github.com>
2026-02-16 15:55:08 +08:00 · 2026-02-04 19:46:15 +02:00 · 2026-02-04 19:46:15 +02:00 · 767b8dcab3
commit 767b8dcab3
parent d90a8e5700
2 changed files with 4 additions and 0 deletions
--- a/examples/auto_deploy/nano_v3.yaml
+++ b/examples/auto_deploy/nano_v3.yaml
@ -45,3 +45,5 @@ transforms:
  fuse_mamba_a_log:
    stage: post_load_fusion
    enabled: true
+  insert_cached_ssm_attention:
+    backend: flashinfer_ssm
--- a/examples/auto_deploy/super_v3.yaml
+++ b/examples/auto_deploy/super_v3.yaml
@ -44,3 +44,5 @@ transforms:
  fuse_mamba_a_log:
    stage: post_load_fusion
    enabled: true
+  insert_cached_ssm_attention:
+    backend: flashinfer_ssm