[https://nvbugs/5816267][fix] Remove weight tensor holder to release memory earlier (#10876)

Signed-off-by: Dongxu Yang <78518666+dongxuy04@users.noreply.github.com>
2026-02-05 02:31:33 +08:00 · 2026-01-21 16:42:52 -08:00 · 2026-01-21 16:42:52 -08:00 · 635cbf01ba
commit 635cbf01ba
parent 5450485bec
1 changed files with 3 additions and 0 deletions
--- a/tensorrt_llm/_torch/pyexecutor/model_loader.py
+++ b/tensorrt_llm/_torch/pyexecutor/model_loader.py
@ -256,6 +256,9 @@ class ModelLoader:
                    f"Fallback to regular model init: {traceback.format_exc(limit=10)}\n"
                )
                model = AutoModelForCausalLM.from_config(config)
+            finally:
+                if 'memo' in locals():
+                    del memo

            model.to("cuda")
            rank_model_storage = get_rank_model_storage(model)