fix: Centralize FX conv impl, add feature

gs-olive · gs-olive · commit 075a028a2214 · 2023-06-04T19:07:47.000-07:00
- Centralize convolution implementation in FX, similar across all source
IRs, including aten, acc, nn
- Enable pass-through of build errors in e2e tests to ensure errors are
not being hidden
- Allow conv layers to take bias inputs in FX, per new functionality
from TRT
diff --git a/py/torch_tensorrt/dynamo/test/test_dynamo_backend.py b/py/torch_tensorrt/dynamo/test/test_dynamo_backend.py
@@ -27,6 +27,7 @@ def test_resnet18(ir):
         "device": torchtrt.Device("cuda:0"),
         "enabled_precisions": {torch.float},
         "ir": ir,
+        "pass_through_build_failures": True,
     }
 
     trt_mod = torchtrt.compile(model, **compile_spec)
@@ -57,6 +58,7 @@ def test_mobilenet_v2(ir):
         "device": torchtrt.Device("cuda:0"),
         "enabled_precisions": {torch.float},
         "ir": ir,
+        "pass_through_build_failures": True,
     }
 
     trt_mod = torchtrt.compile(model, **compile_spec)
@@ -87,6 +89,7 @@ def test_efficientnet_b0(ir):
         "device": torchtrt.Device("cuda:0"),
         "enabled_precisions": {torch.float},
         "ir": ir,
+        "pass_through_build_failures": True,
     }
 
     trt_mod = torchtrt.compile(model, **compile_spec)
@@ -126,6 +129,7 @@ def test_bert_base_uncased(ir):
         "enabled_precisions": {torch.float},
         "truncate_long_and_double": True,
         "ir": ir,
+        "pass_through_build_failures": True,
     }
     trt_mod = torchtrt.compile(model, **compile_spec)
 
@@ -160,6 +164,7 @@ def test_resnet18_half(ir):
         "device": torchtrt.Device("cuda:0"),
         "enabled_precisions": {torch.half},
         "ir": ir,
+        "pass_through_build_failures": True,
     }
 
     trt_mod = torchtrt.compile(model, **compile_spec)
diff --git a/py/torch_tensorrt/fx/converters/acc_ops_converters.py b/py/torch_tensorrt/fx/converters/acc_ops_converters.py
@@ -26,7 +26,7 @@
     trt_transposed_matmul,
 )
 from torch_tensorrt.fx.tracer.acc_tracer.acc_ops import contiguous
-from torch_tensorrt.fx.converters.impl import activation
+from torch_tensorrt.fx.converters.impl import activation, convolution
 
 _LOGGER: logging.Logger = logging.getLogger(__name__)
 
@@ -96,86 +96,20 @@ def acc_ops_conv1d(
     kwargs: Dict[str, Argument],
     name: str,
 ) -> Union[TRTTensor, Sequence[TRTTensor]]:
-    input_val = kwargs["input"]
-    if not isinstance(input_val, TRTTensor):
-        raise RuntimeError(
-            f"Conv received input {input_val} that is not part "
-            "of the TensorRT region!"
-        )
-
-    # Process 1d input with unsqueeze -> conv2d -> squeeze to calculated conv1d
-    unsqueeze_layer = network.add_shuffle(input=input_val)
-    unsqueeze_layer.reshape_dims = tuple([*input_val.shape, 1])
-    set_layer_name(unsqueeze_layer, target, name + "_unsqueeze")
-    input_val = unsqueeze_layer.get_output(0)
-
-    if has_dynamic_shape(input_val.shape):
-        assert input_val.shape[1] != -1, "Channel dim can't be dynamic for convolution."
-
-    # for now we'll assume bias is constant Tensor or None,
-    # and bias being ITensor is not supported in TensorRT api
-    # right now
-    if kwargs["bias"] is not None and not isinstance(kwargs["bias"], torch.Tensor):
-        raise RuntimeError(
-            f"linear {name} has bias of type {type(kwargs['bias'])}, Expect Optional[Tensor]"
-        )
-    bias = to_numpy(kwargs["bias"])  # type: ignore[arg-type]
-    if bias is not None:
-        bias = bias[None]
-    weight = kwargs["weight"]
-
-    if network.has_explicit_precision or isinstance(weight, TRTTensor):
-        weight = get_trt_tensor(network, weight, f"{name}_weight")
-        # Expand 1d weight with unsqueeze for calculation
-        unsqueeze_weight_layer = network.add_shuffle(input=weight)
-        unsqueeze_weight_layer.reshape_dims = tuple([*weight.shape, 1])
-        set_layer_name(unsqueeze_layer, target, name + "_unsqueeze_weight")
-        weight = unsqueeze_weight_layer.get_output(0)
-        weight_shape = tuple(kwargs["weight"].shape)  # type: ignore[union-attr]
-        # will need to use uninitialized weight and set it later to support
-        # ITensor weights
-        dummy_weight = trt.Weights()
-        layer = network.add_convolution_nd(
-            input=input_val,
-            num_output_maps=weight.shape[0],
-            kernel_shape=weight.shape[2:],
-            kernel=dummy_weight,
-            bias=bias,
-        )
-
-        layer.set_input(1, weight)
-    else:
-        if not isinstance(kwargs["weight"], torch.Tensor):
-            raise RuntimeError(
-                f"linear {name} has weight of type {type(kwargs['weight'])}, Expect Optional[Tensor]"
-            )
-        weight = to_numpy(weight)
-        weight = np.expand_dims(weight, -1)
-        layer = network.add_convolution_nd(
-            input=input_val,
-            num_output_maps=weight.shape[0],
-            kernel_shape=weight.shape[2:],
-            kernel=weight,
-            bias=bias,
-        )
-    # expand params to 2d for computation
-    padding = list(kwargs["padding"])
-    padding.append(0)
-    stride = extend_attr_to_tuple(kwargs["stride"], 2)
-    dilation = extend_attr_to_tuple(kwargs["dilation"], 2)
-
-    set_layer_name(layer, target, name)
-    layer.stride_nd = stride
-    layer.padding_nd = padding
-    layer.dilation_nd = dilation
-    if kwargs["groups"] is not None:
-        layer.num_groups = kwargs["groups"]
-
-    result = layer.get_output(0)
-    squeeze_layer = network.add_shuffle(input=result)
-    squeeze_layer.reshape_dims = tuple(result.shape[:-1])
-    set_layer_name(squeeze_layer, target, name + "_squeeze")
-    return squeeze_layer.get_output(0)
+    return convolution.convNd(
+        network,
+        target,
+        source_ir=SourceIR.ACC,
+        name=name,
+        is_conv1d=True,
+        input_val=kwargs["input"],
+        weight=kwargs["weight"],
+        bias=kwargs["bias"],
+        stride=kwargs["stride"],
+        padding=kwargs["padding"],
+        dilation=kwargs["dilation"],
+        groups=kwargs["groups"],
+    )
 
 
 @tensorrt_converter(acc_ops.conv3d)
@@ -187,63 +121,20 @@ def acc_ops_convnd(
     kwargs: Dict[str, Argument],
     name: str,
 ) -> Union[TRTTensor, Sequence[TRTTensor]]:
-    input_val = kwargs["input"]
-
-    if not isinstance(input_val, TRTTensor):
-        raise RuntimeError(
-            f"Conv received input {input_val} that is not part "
-            "of the TensorRT region!"
-        )
-
-    if has_dynamic_shape(input_val.shape):
-        assert input_val.shape[1] != -1, "Channel dim can't be dynamic for convolution."
-
-    # for now we'll assume bias is constant Tensor or None,
-    # and bias being ITensor is not supported in TensorRT api
-    # right now
-    if kwargs["bias"] is not None and not isinstance(kwargs["bias"], torch.Tensor):
-        raise RuntimeError(
-            f"linear {name} has bias of type {type(kwargs['bias'])}, Expect Optional[Tensor]"
-        )
-    bias = to_numpy(kwargs["bias"])  # type: ignore[arg-type]
-
-    if network.has_explicit_precision or isinstance(kwargs["weight"], TRTTensor):
-        weight = get_trt_tensor(network, kwargs["weight"], f"{name}_weight")
-        weight_shape = tuple(kwargs["weight"].shape)  # type: ignore[union-attr]
-        # will need to use uninitialized weight and set it later to support
-        # ITensor weights
-        dummy_weight = trt.Weights()
-        layer = network.add_convolution_nd(
-            input=input_val,
-            num_output_maps=weight.shape[0],
-            kernel_shape=weight.shape[2:],
-            kernel=dummy_weight,
-            bias=bias,
-        )
-
-        layer.set_input(1, weight)
-    else:
-        if not isinstance(kwargs["weight"], torch.Tensor):
-            raise RuntimeError(
-                f"linear {name} has weight of type {type(kwargs['weight'])}, Expect Optional[Tensor]"
-            )
-        weight = to_numpy(kwargs["weight"])
-        layer = network.add_convolution_nd(
-            input=input_val,
-            num_output_maps=weight.shape[0],
-            kernel_shape=weight.shape[2:],
-            kernel=weight,
-            bias=bias,
-        )
-
-    set_layer_name(layer, target, name)
-    layer.stride_nd = kwargs["stride"]
-    layer.padding_nd = kwargs["padding"]
-    layer.dilation_nd = kwargs["dilation"]
-    if kwargs["groups"] is not None:
-        layer.num_groups = kwargs["groups"]
-
-    return layer.get_output(0)
+    return convolution.convNd(
+        network,
+        target,
+        source_ir=SourceIR.ACC,
+        name=name,
+        is_conv1d=False,
+        input_val=kwargs["input"],
+        weight=kwargs["weight"],
+        bias=kwargs["bias"],
+        stride=kwargs["stride"],
+        padding=kwargs["padding"],
+        dilation=kwargs["dilation"],
+        groups=kwargs["groups"],
+    )
 
 
 @tensorrt_converter(acc_ops.conv_transpose2d)
@@ -268,32 +159,36 @@ def acc_ops_conv_transposend(
             input_val.shape[1] != -1
         ), "Channel dim can't be dynamic for transpose convolution."
 
-    # for now we'll assume bias is constant Tensor or None,
-    # and bias being ITensor is not supported in TensorRT api
-    # right now
-    if kwargs["bias"] is not None and not isinstance(kwargs["bias"], torch.Tensor):
-        raise RuntimeError(
-            f"ConvTranspose {name} has bias of type {type(kwargs['bias'])}, Expect Optional[Tensor]"
-        )
-    bias = to_numpy(kwargs["bias"])  # type: ignore[arg-type]
+    if not isinstance(kwargs["bias"], TRTTensor):
+        if kwargs["bias"] is not None and not isinstance(kwargs["bias"], torch.Tensor):
+            raise RuntimeError(
+                f"linear {name} has bias of type {type(kwargs['bias'])}, Expect Optional[Tensor]"
+            )
+        bias = to_numpy(kwargs["bias"])  # type: ignore[arg-type]
+    else:
+        bias = kwargs["bias"]
 
     if network.has_explicit_precision or isinstance(kwargs["weight"], TRTTensor):
         weight = get_trt_tensor(network, kwargs["weight"], f"{name}_weight")
         weight_shape = tuple(kwargs["weight"].shape)  # type: ignore[union-attr]
         # will need to use uninitialized weight and set it later to support
         # ITensor weights
-        dummy_weight = trt.Weights()
 
         # nn.ConvTranspose2d/3d weight size is (in_channels, out_channels/groups, kernel_0, kernel_1, [kernel_2])
         layer = network.add_deconvolution_nd(
             input=input_val,
             num_output_maps=weight.shape[1] * kwargs["groups"],
             kernel_shape=weight.shape[2:],
-            kernel=dummy_weight,
-            bias=bias,
+            kernel=trt.Weights(),
+            bias=trt.Weights() if isinstance(bias, TRTTensor) else bias,
         )
 
         layer.set_input(1, weight)
+
+        # If the bias is a TRTTensor, set it as an input of the layer
+        if isinstance(bias, TRTTensor):
+            bias = get_trt_tensor(network, bias, f"{name}_bias")
+            layer.set_input(2, bias)
     else:
         if not isinstance(kwargs["weight"], torch.Tensor):
             raise RuntimeError(
diff --git a/py/torch_tensorrt/fx/converters/aten_ops_converters.py b/py/torch_tensorrt/fx/converters/aten_ops_converters.py
@@ -22,7 +22,7 @@
 
 from .converter_utils import *  # noqa: F403
 import torch_tensorrt.fx.tracer.acc_tracer.acc_utils as acc_utils
-from torch_tensorrt.fx.converters.impl import activation
+from torch_tensorrt.fx.converters.impl import activation, convolution
 
 _LOGGER: logging.Logger = logging.getLogger(__name__)
 
@@ -129,13 +129,36 @@ def aten_ops_convolution(
     # we do not handle output_padding.
     if args[7] not in ([0], [0, 0], [0, 0, 0]):
         raise RuntimeError(f"Target {target} has non-0 output_padding")
+
     if len(kwargs_new["stride"]) == 1:
-        return acc_ops_converters.acc_ops_conv1d(
-            network, target, None, kwargs_new, name
+        return convolution.convNd(
+            network,
+            target,
+            source_ir=SourceIR.ATEN,
+            name=name,
+            is_conv1d=True,
+            input_val=kwargs_new["input"],
+            weight=kwargs_new["weight"],
+            bias=kwargs_new["bias"],
+            stride=kwargs_new["stride"],
+            padding=kwargs_new["padding"],
+            dilation=kwargs_new["dilation"],
+            groups=kwargs_new["groups"],
         )
     else:
-        return acc_ops_converters.acc_ops_convnd(
-            network, target, None, kwargs_new, name
+        return convolution.convNd(
+            network,
+            target,
+            source_ir=SourceIR.ATEN,
+            name=name,
+            is_conv1d=False,
+            input_val=kwargs_new["input"],
+            weight=kwargs_new["weight"],
+            bias=kwargs_new["bias"],
+            stride=kwargs_new["stride"],
+            padding=kwargs_new["padding"],
+            dilation=kwargs_new["dilation"],
+            groups=kwargs_new["groups"],
         )
 
 
diff --git a/py/torch_tensorrt/fx/converters/converter_utils.py b/py/torch_tensorrt/fx/converters/converter_utils.py
@@ -99,14 +99,17 @@ def get_positive_dim(dim: int, dim_size: int) -> int:
 
 
 def set_layer_name(
-    layer: TRTLayer, target: Target, name: str, source_ir: Optional[SourceIR] = None
+    layer: TRTLayer,
+    target: Union[Target, torch.nn.Module, str],
+    name: str,
+    source_ir: Optional[SourceIR] = None,
 ) -> None:
     """
     Set the TensorRT layer name to "[TensorRT Layer Type]_[Original Op Name]_[FX Node Name with Suffix]"
 
     Args:
         layer (TRTLayer): A TensorRT layer of which we want to set the name.
-        target (Target): A fx node.target. For call_function node, it's the function that
+        target (Target): A fx node.target or submodule. For call_function node, it's the function that
             the node represents.
         name (str): Consists of fx node.name with optional suffix.
         source_ir: (Optional[SourceIR]): The IR producing the op.
diff --git a/py/torch_tensorrt/fx/converters/convolution.py b/py/torch_tensorrt/fx/converters/convolution.py
diff --git a/py/torch_tensorrt/fx/converters/impl/convolution.py b/py/torch_tensorrt/fx/converters/impl/convolution.py

-Original file line number
+Diff line change
@@ @@ -1,212 +1,123 @@ @@
 # @manual=//deeplearning/trt/python:py_tensorrt
 import logging
 -import numpy as np
 -import tensorrt as trt
 import torch
 from ..converter_registry import tensorrt_converter
 from .converter_utils import (
 -    extend_mod_attr_to_tuple,
 -    get_dyn_range,
 -    mark_as_int8_layer,
 -    to_numpy,
 +    SourceIR,
+)
 -logger = logging.getLogger(__name__)
+-
 +from torch_tensorrt.fx.converters.impl import convolution, activation
 -def common_conv(network, mod, dimension, input_val, layer_name, is_quantized):
 -    if mod.padding_mode != "zeros":
 -        raise RuntimeError(f"Only support padding mode: zeros, got {mod.padding_mode}.")
+-
 -    kernel_size = extend_mod_attr_to_tuple(mod, "kernel_size", dimension)
 -    stride = extend_mod_attr_to_tuple(mod, "stride", dimension)
 -    padding = extend_mod_attr_to_tuple(mod, "padding", dimension)
 -    dilation = extend_mod_attr_to_tuple(mod, "dilation", dimension)
+-
 -    kernel = to_numpy(mod.weight() if is_quantized else mod.weight)
 -    bias = to_numpy(mod.bias() if is_quantized else mod.bias)
+-
 -    if dimension == 1:
 -        # Append unsqueeze before conv2d to calculate conv1d
 -        unsqueeze_layer = network.add_shuffle(input=input_val)
 -        unsqueeze_layer.reshape_dims = (*input_val.shape, 1)
 -        unsqueeze_layer.name = f"{layer_name}_unsqueeze"
 -        input_val = unsqueeze_layer.get_output(0)
+-
 -        kernel = np.expand_dims(kernel, -1)
 -        kernel_size = kernel.shape[2:]
 -        if bias is not None:
 -            bias = bias[None]
 -        stride = (stride[0], 1)
 -        padding = (padding[0], 0)
 -        dilation = (dilation[0], 1)
 -    layer = network.add_convolution_nd(
 -        input=input_val,
 -        num_output_maps=mod.out_channels,
 -        kernel_shape=kernel_size,
 -        kernel=kernel,
 -        bias=bias,
 -    )
 -    layer.name = layer_name
 -    layer.stride_nd = stride
 -    layer.padding_nd = padding
 -    layer.dilation_nd = dilation
 -    layer.num_groups = mod.groups
+-
 -    if is_quantized:
 -        # Assume the dtype of activation is torch.quint8
 -        mark_as_int8_layer(
 -            layer, get_dyn_range(mod.scale, mod.zero_point, torch.quint8)
 -        )
+-
 -    result = layer.get_output(0)
 -    if dimension == 1:
 -        # Append squeeze after conv2d to calculate conv1d
 -        squeeze_layer = network.add_shuffle(input=result)
 -        squeeze_layer.reshape_dims = tuple(result.shape[:-1])
 -        squeeze_layer.name = f"{layer_name}_squeeze"
 -        result = squeeze_layer.get_output(0)
+-
 -    return result
+-
+-
 -def common_conv_relu(network, mod, dimension, input_val, layer_name, is_quantized):
 -    conv_output = common_conv(
 -        network,
 -        mod,
 -        dimension=2,
 -        input_val=input_val,
 -        layer_name=f"{layer_name}_conv",
 -        is_quantized=is_quantized,
 -    )
+-
 -    layer = network.add_activation(input=conv_output, type=trt.ActivationType.RELU)
 -    layer.name = f"{layer_name}_relu"
+-
 -    if is_quantized:
 -        mark_as_int8_layer(layer, conv_output.dynamic_range)
+-
 -    return layer.get_output(0)
 +logger = logging.getLogger(__name__)
 @tensorrt_converter(torch.nn.modules.conv.Conv1d)
 def conv1d(network, submod, args, kwargs, layer_name):
     # args/kwargs should have already been normalized to kwargs
     assert len(args) == 0
 -    input_val = kwargs["input"]
+-
 -    if not isinstance(input_val, trt.tensorrt.ITensor):
 -        raise RuntimeError(
 -            f"Conv1d received input {input_val} that is not part "
 -            "of the TensorRT region!"
 -        )
     if layer_name is None:
         raise RuntimeError("layer name is none")
 -    return common_conv(
 +    return convolution.convNd(
         network,
 -        submod,
 -        dimension=1,
 -        input_val=input_val,
 -        layer_name=layer_name,
 -        is_quantized=False,
 +        submod._get_name(),
 +        source_ir=SourceIR.NN,
 +        name=layer_name,
 +        is_conv1d=True,
 +        input_val=kwargs["input"],
 +        weight=submod.weight,
 +        bias=submod.bias,
 +        stride=getattr(submod, "stride"),
 +        padding=getattr(submod, "padding"),
 +        dilation=getattr(submod, "dilation"),
 +        groups=submod.groups,
+    )
 @tensorrt_converter(torch.nn.modules.conv.Conv2d)
 def conv2d(network, submod, args, kwargs, layer_name):
     # args/kwargs should have already been normalized to kwargs
     assert len(args) == 0
 -    input_val = kwargs["input"]
+-
 -    if not isinstance(input_val, trt.tensorrt.ITensor):
 -        raise RuntimeError(
 -            f"Conv2d received input {input_val} that is not part "
 -            "of the TensorRT region!"
 -        )
+-
 -    return common_conv(
 +    return convolution.convNd(
         network,
 -        submod,
 -        dimension=2,
 -        input_val=input_val,
 -        layer_name=layer_name,
 -        is_quantized=False,
 +        submod._get_name(),
 +        source_ir=SourceIR.NN,
 +        name=layer_name,
 +        is_conv1d=False,
 +        input_val=kwargs["input"],
 +        weight=submod.weight,
 +        bias=submod.bias,
 +        stride=getattr(submod, "stride"),
 +        padding=getattr(submod, "padding"),
 +        dilation=getattr(submod, "dilation"),
 +        groups=submod.groups,
+    )
 @tensorrt_converter(torch.nn.modules.conv.Conv3d)
 def conv3d(network, submod, args, kwargs, layer_name):
     # args/kwargs should have already been normalized to kwargs
     assert len(args) == 0
 -    input_val = kwargs["input"]
 -    # TODO: Remove this warning when https://github.com/pytorch/TensorRT/issues/1445 is fixed
 -    kernel = to_numpy(submod.weight)
 -    kernel_size_one = True
 -    if len(kernel.shape) == 5:
 -        for filter_size in kernel.shape[2:]:
 -            if filter_size != 1:
 -                kernel_size_one = False
 -    if kernel_size_one:
 -        logger.warn(
 -            "Conv3d layer with kernel size = 1 configuration incurs a failure with TensorRT tactic optimizer in some cases. \
 -        Github issue: https://github.com/pytorch/TensorRT/issues/1445. Other conv variants do not have this issue."
 -        )
+-
 -    if not isinstance(input_val, trt.tensorrt.ITensor):
 -        raise RuntimeError(
 -            f"Conv3d received input {input_val} that is not part "
 -            "of the TensorRT region!"
 -        )
+-
 -    return common_conv(
 +    return convolution.convNd(
         network,
 -        submod,
 -        dimension=3,
 -        input_val=input_val,
 -        layer_name=layer_name,
 -        is_quantized=False,
 +        submod._get_name(),
 +        source_ir=SourceIR.NN,
 +        name=layer_name,
 +        is_conv1d=False,
 +        input_val=kwargs["input"],
 +        weight=submod.weight,
 +        bias=submod.bias,
 +        stride=getattr(submod, "stride"),
 +        padding=getattr(submod, "padding"),
 +        dilation=getattr(submod, "dilation"),
 +        groups=submod.groups,
+    )
 @tensorrt_converter(torch.nn.quantized.modules.conv.Conv2d)
 def quantized_conv2d(network, submod, args, kwargs, layer_name):
     input_val = args[0]
+-
 -    if not isinstance(input_val, trt.tensorrt.ITensor):
 -        raise RuntimeError(
 -            f"Quantized Conv2d received input {input_val} that is not part "
 -            "of the TensorRT region!"
 -        )
+-
 -    return common_conv(
 +    return convolution.convNd(
         network,
 -        submod,
 -        dimension=2,
 +        submod._get_name(),
 +        source_ir=SourceIR.NN,
 +        name=layer_name,
 +        is_conv1d=False,
         input_val=input_val,
 -        layer_name=layer_name,
 -        is_quantized=True,
 +        weight=submod.weight(),
 +        bias=submod.bias(),
 +        stride=getattr(submod, "stride"),
 +        padding=getattr(submod, "padding"),
 +        dilation=getattr(submod, "dilation"),
 +        groups=submod.groups,
 +        scale=submod.scale,
 +        zero_point=submod.zero_point,
+    )
 @tensorrt_converter(torch.nn.intrinsic.quantized.modules.ConvReLU2d)
 def quantized_conv_relu2d(network, submod, args, kwargs, layer_name):
     input_val = args[0]
+-
 -    if not isinstance(input_val, trt.tensorrt.ITensor):
 -        raise RuntimeError(
 -            f"Quantized ConvReLU2d received input {input_val} that is not part "
 -            "of the TensorRT region!"
 -        )
+-
 -    return common_conv_relu(
 +    conv_out = convolution.convNd(
         network,
 -        submod,
 -        dimension=2,
 +        submod._get_name(),
 +        source_ir=SourceIR.NN,
 +        name=layer_name,
 +        is_conv1d=False,
         input_val=input_val,
 -        layer_name=f"{layer_name}_conv",
 -        is_quantized=True,
 +        weight=submod.weight(),
 +        bias=submod.bias(),
 +        stride=getattr(submod, "stride"),
 +        padding=getattr(submod, "padding"),
 +        dilation=getattr(submod, "dilation"),
 +        groups=submod.groups,
 +        scale=submod.scale,
 +        zero_point=submod.zero_point,
 +    )
++
 +    return activation.relu(
 +        network, submod._get_name(), SourceIR.NN, layer_name + "_relu", conv_out
+    )
-Original file line number
+Diff line change
@@ @@ -0,0 +1,159 @@ @@
 +import numpy as np
 +from typing import Any, Callable, Optional, Sequence, Union
++
 +# @manual=//deeplearning/trt/python:py_tensorrt
 +import tensorrt as trt
 +import torch
 +from torch.fx.node import Target
++
 +from torch_tensorrt.fx.converters.converter_utils import (
 +    SourceIR,
 +    extend_attr_to_tuple,
 +    get_dyn_range,
 +    mark_as_int8_layer,
 +    set_layer_name,
 +    has_dynamic_shape,
 +    to_numpy,
 +    get_trt_tensor,
 +)
 +from torch_tensorrt.fx.converters.acc_ops_converters import (
 +    acc_ops_unsqueeze,
 +    acc_ops_squeeze,
 +)
++
 +from torch_tensorrt.fx.types import (
 +    TRTNetwork,
 +    TRTTensor,
 +)
++
++
 +def convNd(
 +    network: TRTNetwork,
 +    target: Union[Target, str],
 +    source_ir: Optional[SourceIR],
 +    name: str,
 +    is_conv1d: bool,
 +    input_val: TRTTensor,
 +    weight: Union[TRTTensor, torch.Tensor],
 +    bias: Optional[Union[TRTTensor, torch.Tensor]],
 +    stride: Optional[Union[int, Sequence[int]]],
 +    padding: Optional[Union[int, Sequence[int]]],
 +    dilation: Optional[Union[int, Sequence[int]]],
 +    groups: Optional[int],
 +    scale: Optional[Union[torch.Tensor, float]] = None,
 +    zero_point: Optional[Union[torch.Tensor, float]] = None,
 +) -> TRTTensor:
++
 +    if has_dynamic_shape(input_val.shape):
 +        assert input_val.shape[1] != -1, "Channel dim can't be dynamic for convolution."
++
 +    if is_conv1d:
 +        # Apply an unsqueeze operation to transform the conv1d problem into conv2d
 +        kwargs = {
 +            "input": input_val,
 +            "dim": -1,
 +        }
 +        input_val = acc_ops_unsqueeze(
 +            network, target, tuple(), kwargs, name + "_unsqueeze"
 +        )
++
 +    # Process bias terms
 +    if isinstance(bias, torch.Tensor):
 +        # Transform the bias constant into a Numpy array
 +        bias = to_numpy(bias)
++
 +        # Prepend new dimension (unsqueeze) if the convolution is 1d
 +        if is_conv1d:
 +            bias = np.expand_dims(bias, 0)
++
 +    elif isinstance(bias, TRTTensor):
 +        bias = get_trt_tensor(network, bias, f"{name}_bias")
 +        # Prepend new dimension (unsqueeze) if the convolution is 1d
 +        if is_conv1d:
 +            kwargs = {
 +                "input": bias,
 +                "dim": 0,
 +            }
 +            bias = acc_ops_unsqueeze(
 +                network, target, tuple(), kwargs, name + "_unsqueeze_bias"
 +            )
++
 +    elif bias is not None:
 +        raise RuntimeError(
 +            f"Convolution {name} has bias of type {type(bias)}, Expected Torch Tensor or TRT Tensor"
 +        )
++
 +    # Process weight terms
 +    if network.has_explicit_precision or isinstance(weight, TRTTensor):
 +        weight = get_trt_tensor(network, weight, f"{name}_weight")
 +        # Append new dimension (unsqueeze) if the convolution is 1d
 +        if is_conv1d:
 +            kwargs = {
 +                "input": weight,
 +                "dim": -1,
 +            }
 +            weight = acc_ops_unsqueeze(
 +                network, target, tuple(), kwargs, name + "_unsqueeze_weight"
 +            )
++
 +    elif isinstance(weight, torch.Tensor):
 +        # Transform the weight constant into a Numpy array
 +        weight = to_numpy(weight)
++
 +        # Append new dimension (unsqueeze) if the convolution is 1d
 +        if is_conv1d:
 +            weight = np.expand_dims(weight, -1)
++
 +    else:
 +        raise RuntimeError(
 +            f"Convolution {name} has weight of type {type(weight)}, Expect Optional[Tensor]"
 +        )
++
 +    conv_layer = network.add_convolution_nd(
 +        input=input_val,
 +        num_output_maps=weight.shape[0],
 +        kernel_shape=weight.shape[2:],
 +        kernel=trt.Weights() if isinstance(weight, TRTTensor) else weight,
 +        bias=trt.Weights() if isinstance(bias, TRTTensor) else bias,
 +    )
++
 +    # If the weight is a TRTTensor, set it as an input of the layer
 +    if isinstance(weight, TRTTensor):
 +        conv_layer.set_input(1, weight)
++
 +    # If the bias is a TRTTensor, set it as an input of the layer
 +    if isinstance(bias, TRTTensor):
 +        conv_layer.set_input(2, bias)
++
 +    # Expand parameters manually for Conv1D computations
 +    if is_conv1d:
 +        padding = tuple(padding) + (0,)
 +        stride = extend_attr_to_tuple(stride, 2)
 +        dilation = extend_attr_to_tuple(dilation, 2)
++
 +    set_layer_name(conv_layer, target, name, source_ir)
++
 +    # Set relevant attributes of convolution layer
 +    conv_layer.padding_nd = padding
 +    conv_layer.stride_nd = stride
 +    conv_layer.dilation_nd = dilation
++
 +    if groups is not None:
 +        conv_layer.num_groups = groups
++
 +    # Handle quantization cases
 +    if scale is not None and zero_point is not None:
 +        # Assume the dtype of activation is torch.quint8
 +        mark_as_int8_layer(conv_layer, get_dyn_range(scale, zero_point, torch.quint8))
++
 +    result = conv_layer.get_output(0)
++
 +    if is_conv1d:
 +        # Apply a squeeze operation to transform the conv2d problem back into conv1d
 +        kwargs = {
 +            "input": result,
 +            "dim": -1,
 +        }
 +        result = acc_ops_squeeze(network, target, tuple(), kwargs, name + "_squeeze")
++
 +    return result