pytorch
diff --git a/‎aten/src/ATen/native/quantized/cpu/conv_packed_params.h‎
Lines changed: 2 additions & 0 deletions b/‎aten/src/ATen/native/quantized/cpu/conv_packed_params.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎aten/src/ATen/native/quantized/cpu/fbgemm_utils.cpp‎
Lines changed: 41 additions & 12 deletions b/‎aten/src/ATen/native/quantized/cpu/fbgemm_utils.cpp‎
Lines changed: 41 additions & 12 deletions
diff --git a/‎aten/src/ATen/native/quantized/cpu/fbgemm_utils.h‎
Lines changed: 17 additions & 1 deletion b/‎aten/src/ATen/native/quantized/cpu/fbgemm_utils.h‎
Lines changed: 17 additions & 1 deletion
@@ -18,6 +18,8 @@ struct ConvPackedParamsBase : public torch::jit::CustomClassHolder {
 
   virtual torch::List<int64_t> stride() const = 0;
   virtual torch::List<int64_t> padding() const = 0;
+  virtual torch::List<int64_t> output_padding() const = 0;
   virtual torch::List<int64_t> dilation() const = 0;
   virtual int64_t groups() const = 0;
+  virtual bool transpose() const = 0;
 };
@@ -212,16 +212,20 @@ Tensor ConvertToChannelsLast3dTensor(const Tensor& src) {
 
 template <int kSpatialDim = 2>
 CAFFE2_API torch::jit::class_<ConvPackedParamsBase<kSpatialDim>> register_conv_params() {
+  // Note: SerializationType order should be fixed.
+  //       See onnx/unpack_quantized_weights.cpp
   using SerializationType = std::tuple<
-    at::Tensor,
-    c10::optional<at::Tensor>,
+    at::Tensor /*weight*/,
+    c10::optional<at::Tensor> /*bias*/,
     // these are meant to be torch::List<int64_t> but
     // it's not supported by onnx, so we'll use Tensor as
     // a workaround
-    torch::List<at::Tensor>,
-    torch::List<at::Tensor>,
-    torch::List<at::Tensor>,
-    at::Tensor>;
+    torch::List<at::Tensor> /*stride*/,
+    torch::List<at::Tensor> /*padding*/,
+    torch::List<at::Tensor> /*dilation*/,
+    at::Tensor /*groups*/,
+    at::Tensor /*transpose*/,
+    torch::List<at::Tensor> /*output_padding*/>;
   static auto register_conv_params =
     torch::jit::class_<ConvPackedParamsBase<kSpatialDim>>(
         "quantized", "Conv" + c10::to_string(kSpatialDim) + "dPackedParamsBase")
@@ -233,46 +237,67 @@ CAFFE2_API torch::jit::class_<ConvPackedParamsBase<kSpatialDim>> register_conv_p
           std::tie(weight, bias) = params->unpack();
           torch::List<at::Tensor> stride;
           torch::List<at::Tensor> padding;
+          torch::List<at::Tensor> output_padding;
           torch::List<at::Tensor> dilation;
           at::Tensor groups;
+          at::Tensor transpose;
           for (int64_t s : params->stride()) {
             stride.emplace_back(at::tensor(s));
           }
           for (int64_t p : params->padding()) {
             padding.emplace_back(at::tensor(p));
           }
+          for (int64_t p : params->output_padding()) {
+            output_padding.emplace_back(at::tensor(p));
+          }
           for (int64_t d : params->dilation()) {
             dilation.emplace_back(at::tensor(d));
           }
           groups = at::tensor(params->groups());
+          transpose = at::tensor((uint8_t)params->transpose());
           return std::make_tuple(
               std::move(weight),
               std::move(bias),
               stride,
               padding,
               dilation,
-              groups);
+              groups,
+              transpose,
+              output_padding);
         },
         [](SerializationType state)
         -> c10::intrusive_ptr<ConvPackedParamsBase<kSpatialDim>> { // __setstate__
           at::Tensor weight;
           c10::optional<at::Tensor> bias;
           torch::List<at::Tensor> stride_tensor, padding_tensor,
-            dilation_tensor;
+            output_padding_tensor, dilation_tensor;
           at::Tensor groups_tensor;
-          torch::List<int64_t> stride, padding, dilation;
+          at::Tensor transpose_tensor;
+          torch::List<int64_t> stride, padding, output_padding, dilation;
           int64_t groups;
-          std::tie(weight, bias, stride_tensor, padding_tensor, dilation_tensor, groups_tensor) = state;
+          uint8_t transpose;
+          std::tie(weight,
+                   bias,
+                   stride_tensor,
+                   padding_tensor,
+                   dilation_tensor,
+                   groups_tensor,
+                   transpose_tensor,
+                   output_padding_tensor) = state;
           for (at::Tensor s : stride_tensor) {
             stride.emplace_back(s[0].item<int64_t>());
           }
           for (at::Tensor p : padding_tensor) {
             padding.emplace_back(p[0].item<int64_t>());
           }
+          for (at::Tensor p : output_padding_tensor) {
+            output_padding.emplace_back(p[0].item<int64_t>());
+          }
           for (at::Tensor d : dilation_tensor) {
             dilation.emplace_back(d[0].item<int64_t>());
           }
           groups = groups_tensor[0].item<int64_t>();
+          transpose = transpose_tensor[0].item<uint8_t>();
           auto& ctx = at::globalContext();
 
 #ifdef USE_FBGEMM
@@ -282,8 +307,10 @@ CAFFE2_API torch::jit::class_<ConvPackedParamsBase<kSpatialDim>> register_conv_p
                 bias,
                 stride,
                 padding,
+                output_padding,
                 dilation,
-                groups);
+                groups,
+                transpose);
           }
 #endif // USE_FBGEMM
 #ifdef USE_PYTORCH_QNNPACK
@@ -297,8 +324,10 @@ CAFFE2_API torch::jit::class_<ConvPackedParamsBase<kSpatialDim>> register_conv_p
                 bias,
                 stride,
                 padding,
+                output_padding,
                 dilation,
-                groups);
+                groups,
+                transpose);
           }
 #endif // USE_PYTORCH_QNNPACK
           TORCH_CHECK(
 
@@ -123,8 +123,10 @@ struct CAFFE2_API PackedConvWeight : public ConvPackedParamsBase<kSpatialDim> {
       c10::optional<at::Tensor> bias,
       torch::List<int64_t> stride,
       torch::List<int64_t> padding,
+      torch::List<int64_t> output_padding,
       torch::List<int64_t> dilation,
       int64_t groups,
+      uint8_t transpose,
       std::vector<int32_t> col_offsets,
       std::vector<int64_t> kernel,
       std::vector<float> w_scale,
@@ -134,8 +136,10 @@ struct CAFFE2_API PackedConvWeight : public ConvPackedParamsBase<kSpatialDim> {
     bias(std::move(bias)),
     stride_(std::move(stride)),
     padding_(std::move(padding)),
+    output_padding_(std::move(output_padding)),
     dilation_(std::move(dilation)),
     groups_(groups),
+    transpose_(transpose),
     col_offsets(std::move(col_offsets)),
     kernel(std::move(kernel)),
     w_scale(std::move(w_scale)),
@@ -146,8 +150,10 @@ struct CAFFE2_API PackedConvWeight : public ConvPackedParamsBase<kSpatialDim> {
   c10::optional<at::Tensor> bias;
   torch::List<int64_t> stride_;
   torch::List<int64_t> padding_;
+  torch::List<int64_t> output_padding_;
   torch::List<int64_t> dilation_;
   int64_t groups_;
+  uint8_t transpose_;
   std::vector<int32_t> col_offsets;
   std::vector<int64_t> kernel;
   std::vector<float> w_scale;
@@ -171,8 +177,10 @@ struct CAFFE2_API PackedConvWeight : public ConvPackedParamsBase<kSpatialDim> {
       c10::optional<at::Tensor> bias,
       torch::List<int64_t> stride,
       torch::List<int64_t> padding,
+      torch::List<int64_t> output_padding,
       torch::List<int64_t> dilation,
-      int64_t groups);
+      int64_t groups,
+      bool transpose);
 
   const float* GetBiasData(at::Tensor* bias);
 
@@ -190,6 +198,10 @@ struct CAFFE2_API PackedConvWeight : public ConvPackedParamsBase<kSpatialDim> {
     return padding_;
   }
 
+  torch::List<int64_t> output_padding() const override {
+    return output_padding_;
+  }
+
   torch::List<int64_t> dilation() const override {
     return dilation_;
   }
@@ -198,6 +210,10 @@ struct CAFFE2_API PackedConvWeight : public ConvPackedParamsBase<kSpatialDim> {
     return groups_;
   }
 
+  bool transpose() const override {
+    return (bool)transpose_;
+  }
+
  private:
   template <bool ReluFused>
   at::Tensor apply_impl(