[None][feat] Support running heterogeneous model execution for Nemotron-H (#6866)

danielafrimi · web-flow · commit bda42f8c3a3e · 2025-08-13T19:51:19.000+03:00
Signed-off-by: Daniel Afrimi &lt;danielafrimi8@gmail.com&gt;
diff --git a/tensorrt_llm/_torch/models/modeling_nemotron_h.py b/tensorrt_llm/_torch/models/modeling_nemotron_h.py
@@ -63,8 +63,16 @@ def __init__(
         layer_idx: int,
     ):
         config = model_config.pretrained_config
+        if isinstance(config.intermediate_size, list):
+            if len(config.intermediate_size) == 1:
+                intermediate_size = config.intermediate_size[0]
+            else:
+                intermediate_size = config.intermediate_size[layer_idx]
+        else:
+            intermediate_size = config.intermediate_size
+
         super().__init__(hidden_size=config.hidden_size,
-                         intermediate_size=config.intermediate_size,
+                         intermediate_size=intermediate_size,
                          bias=False,
                          activation=relu2,
                          dtype=config.torch_dtype,