pytorch · resistor · Jul 25, 2018
diff --git a/aten/src/ATen/div_rtn.h b/aten/src/ATen/div_rtn.h
@@ -0,0 +1,11 @@
+#pragma once
+
+// Integer division rounding to -Infinity
+template<typename T>
+static inline T div_rtn(T x, T y) {
+    int q = x/y;
+    int r = x%y;
+    if ((r!=0) && ((r<0) != (y<0))) --q;
+    return q;
+}
+
diff --git a/aten/src/THCUNN/generic/Col2Im.cu b/aten/src/THCUNN/generic/Col2Im.cu
@@ -2,6 +2,8 @@
 #define THC_GENERIC_FILE "generic/Col2Im.cu"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(Col2Im_shapeCheck)(
                          THCState *state,
                          THCTensor *input,
@@ -31,8 +33,8 @@ static inline void THNN_(Col2Im_shapeCheck)(
   }
 
   int64_t inputLength  = input->size(batch_dim + 2);
-  int64_t nBlocksH = 1 + (outputHeight + 2 * padH - dH * (kH - 1) - 1) / sH;
-  int64_t nBlocksW = 1 + ( outputWidth + 2 * padW - dW * (kW - 1) - 1) / sW;
+  int64_t nBlocksH = div_rtn<int64_t>(outputHeight + 2 * padH - dH * (kH - 1) - 1, sH) + 1;
+  int64_t nBlocksW = div_rtn<int64_t>(outputWidth + 2 * padW - dW * (kW - 1) - 1, sW) + 1;
 
   if (inputLength != (nBlocksH * nBlocksW)) {
     THError("Given output_size=(%d, %d), kernel_size=(%d, %d), "

diff --git a/aten/src/THCUNN/generic/Im2Col.cu b/aten/src/THCUNN/generic/Im2Col.cu
@@ -2,6 +2,8 @@
 #define THC_GENERIC_FILE "generic/Im2Col.cu"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(Im2Col_shapeCheck)(
                          THCState *state,
                          THCTensor *input,
@@ -29,8 +31,8 @@ static inline void THNN_(Im2Col_shapeCheck)(
   int64_t nInputPlane  = THCTensor_(size)(state, input, dim_batch + 1);
   int64_t inputHeight  = THCTensor_(size)(state, input, dim_batch + 2);
   int64_t inputWidth   = THCTensor_(size)(state, input, dim_batch + 3);
-  int64_t outputHeight = (inputHeight + 2 * padH - (dH * (kH - 1) + 1)) / sH + 1;
-  int64_t outputWidth  = (inputWidth + 2 * padW - (dW * (kW - 1) + 1)) / sW + 1;
+  int64_t outputHeight = div_rtn<int64_t>(inputHeight + 2 * padH - (dH * (kH - 1) + 1),  sH) + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(inputWidth + 2 * padW - (dW * (kW - 1) + 1), sW) + 1;
 
   if (outputHeight < 1 || outputWidth < 1) {
     THError("Given input with spatial size (%d, %d), kernel_size=(%d, %d), "

diff --git a/aten/src/THCUNN/generic/SpatialConvolutionMM.cu b/aten/src/THCUNN/generic/SpatialConvolutionMM.cu
@@ -2,6 +2,8 @@
 #define THC_GENERIC_FILE "generic/SpatialConvolutionMM.cu"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(SpatialConvolutionMM_shapeCheck)(
                          THCState *state,
                          THCTensor *input, THCTensor *gradOutput,
@@ -49,8 +51,8 @@ static inline void THNN_(SpatialConvolutionMM_shapeCheck)(
       exactInputHeight, exactInputWidth, kH, kW);
   }
 
-  int64_t outputHeight = (exactInputHeight - kH) / dH + 1;
-  int64_t outputWidth  = (exactInputWidth - kW) / dW + 1;
+  int64_t outputHeight = div_rtn<int64_t>(exactInputHeight - kH, dH) + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(exactInputWidth - kW, dW) + 1;
 
   if (outputWidth < 1 || outputHeight < 1) {
     THError("Given input size per channel: (%ld x %ld). "

diff --git a/aten/src/THCUNN/generic/SpatialDilatedConvolution.cu b/aten/src/THCUNN/generic/SpatialDilatedConvolution.cu
@@ -2,6 +2,8 @@
 #define THC_GENERIC_FILE "generic/SpatialDilatedConvolution.cu"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(SpatialDilatedConvolution_shapeCheck)(
                          THCState *state,
                          THCTensor *input, THCTensor *gradOutput,
@@ -44,8 +46,8 @@ static inline void THNN_(SpatialDilatedConvolution_shapeCheck)(
    int64_t inputHeight  = input->size(dimh);
    int64_t inputWidth   = input->size(dimw);
 
-   int64_t outputHeight = (inputHeight + 2*padH - (dilationH * (kH - 1) + 1)) / dH + 1;
-   int64_t outputWidth  = (inputWidth + 2*padW - (dilationW * (kW - 1) + 1)) / dW + 1;
+   int64_t outputHeight = div_rtn<int64_t>(inputHeight + 2*padH - (dilationH * (kH - 1) + 1), dH) + 1;
+   int64_t outputWidth  = div_rtn<int64_t>(inputWidth + 2*padW - (dilationW * (kW - 1) + 1), dW) + 1;
 
    if (outputWidth < 1 || outputHeight < 1) {
     THError("Given input size per channel: (%ld x %ld). "

diff --git a/aten/src/THCUNN/generic/VolumetricConvolution.cu b/aten/src/THCUNN/generic/VolumetricConvolution.cu
@@ -2,6 +2,8 @@
 #define THC_GENERIC_FILE "generic/VolumetricConvolution.cu"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(VolumetricConvolution_shapeCheck)
                         (THCState *state,
                          THCTensor *input,
@@ -83,9 +85,9 @@ static inline void THNN_(VolumetricConvolution_shapeCheck)
       exactInputDepth,exactInputHeight,exactInputWidth,kT,kH,kW);
   }
 
-  int64_t outputWidth  = (exactInputDepth - kH) / dH + 1;
-  int64_t outputHeight = (exactInputHeight - kT) / dT + 1;
-  int64_t outputDepth  = (exactInputWidth - kW) / dW + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(exactInputDepth - kH, dH) + 1;
+  int64_t outputHeight = div_rtn<int64_t>(exactInputHeight - kT, dT) + 1;
+  int64_t outputDepth  = div_rtn<int64_t>(exactInputWidth - kW, dW) + 1;
 
   if (outputWidth < 1 || outputHeight < 1 || outputDepth < 1)
   {

diff --git a/aten/src/THCUNN/generic/VolumetricDilatedConvolution.cu b/aten/src/THCUNN/generic/VolumetricDilatedConvolution.cu
@@ -2,6 +2,8 @@
 #define THC_GENERIC_FILE "generic/VolumetricDilatedConvolution.cu"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(VolumetricDilatedConvolution_shapeCheck)(
                          THCState *state,
                          THCTensor *input,
@@ -53,9 +55,9 @@ static inline void THNN_(VolumetricDilatedConvolution_shapeCheck)(
   int64_t inputDepth  = input->size(dimd);
   int64_t inputHeight  = input->size(dimh);
   int64_t inputWidth   = input->size(dimw);
-  int64_t outputDepth  = (inputDepth  + 2*padT - (dilationT * (kT - 1) + 1)) / dT + 1;
-  int64_t outputHeight = (inputHeight + 2*padH - (dilationH * (kH - 1) + 1)) / dH + 1;
-  int64_t outputWidth  = (inputWidth  + 2*padW - (dilationW * (kW - 1) + 1)) / dW + 1;
+  int64_t outputDepth  = div_rtn<int64_t>(inputDepth  + 2*padT - (dilationT * (kT - 1) + 1), dT) + 1;
+  int64_t outputHeight = div_rtn<int64_t>(inputHeight + 2*padH - (dilationH * (kH - 1) + 1), dH) + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(inputWidth  + 2*padW - (dilationW * (kW - 1) + 1), dW) + 1;
 
   if (outputDepth < 1 || outputWidth < 1 || outputHeight < 1) {
     THError("Given input size per channel: (%ld x %ld x %ld). "

diff --git a/aten/src/THNN/generic/Col2Im.c b/aten/src/THNN/generic/Col2Im.c
@@ -2,6 +2,8 @@
 #define TH_GENERIC_FILE "generic/Col2Im.c"
 #else
 
+#include <ATen/div_rtn.h>
+
 // Note [im2col/col2im output padding]
 // ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 // Our implementations of im2col and col2im take both the input height/width as
@@ -138,8 +140,8 @@ static inline void THNN_(Col2Im_shapeCheck)(
   }
 
   int64_t inputLength  = input->size(batch_dim + 2);
-  int64_t nBlocksH = 1 + (outputHeight + 2 * padH - dH * (kH - 1) - 1) / sH;
-  int64_t nBlocksW = 1 + ( outputWidth + 2 * padW - dW * (kW - 1) - 1) / sW;
+  int64_t nBlocksH = div_rtn<int64_t>(outputHeight + 2 * padH - dH * (kH - 1) - 1, sH) + 1;
+  int64_t nBlocksW = div_rtn<int64_t>(outputWidth + 2 * padW - dW * (kW - 1) - 1, sW) + 1;
 
   if (inputLength != (nBlocksH * nBlocksW)) {
     THError("Given output_size=(%d, %d), kernel_size=(%d, %d), "

diff --git a/aten/src/THNN/generic/Im2Col.c b/aten/src/THNN/generic/Im2Col.c
@@ -2,6 +2,8 @@
 #define TH_GENERIC_FILE "generic/Im2Col.c"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(Im2Col_shapeCheck)(
                          THNNState *state,
                          THTensor *input,
@@ -27,8 +29,8 @@ static inline void THNN_(Im2Col_shapeCheck)(
   int64_t nInputPlane  = THTensor_(size)(input, dim_batch + 1);
   int64_t inputHeight  = THTensor_(size)(input, dim_batch + 2);
   int64_t inputWidth   = THTensor_(size)(input, dim_batch + 3);
-  int64_t outputHeight = (inputHeight + 2 * padH - (dH * (kH - 1) + 1)) / sH + 1;
-  int64_t outputWidth  = (inputWidth + 2 * padW - (dW * (kW - 1) + 1)) / sW + 1;
+  int64_t outputHeight = div_rtn<int64_t>(inputHeight + 2 * padH - (dH * (kH - 1) + 1), sH) + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(inputWidth + 2 * padW - (dW * (kW - 1) + 1), sW) + 1;
   int64_t nOutputPlane = nInputPlane * kW * kH;
   int64_t outputLength = outputHeight * outputWidth;
 

diff --git a/aten/src/THNN/generic/SpatialConvolutionMM.c b/aten/src/THNN/generic/SpatialConvolutionMM.c
@@ -2,6 +2,8 @@
 #define TH_GENERIC_FILE "generic/SpatialConvolutionMM.c"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(SpatialConvolutionMM_shapeCheck)(
 	THTensor *input, THTensor *gradOutput,
 	THTensor *weight, THTensor *bias,
@@ -48,8 +50,8 @@ static inline void THNN_(SpatialConvolutionMM_shapeCheck)(
       exactInputHeight, exactInputWidth, kH, kW);
   }
 
-  int64_t outputHeight = (exactInputHeight - kH) / dH + 1;
-  int64_t outputWidth  = (exactInputWidth - kW) / dW + 1;
+  int64_t outputHeight = div_rtn<int64_t>(exactInputHeight - kH, dH) + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(exactInputWidth - kW, dW) + 1;
 
   if (outputWidth < 1 || outputHeight < 1) {
     THError("Given input size per channel: (%ld x %ld). "

diff --git a/aten/src/THNN/generic/SpatialDilatedConvolution.c b/aten/src/THNN/generic/SpatialDilatedConvolution.c
@@ -2,6 +2,8 @@
 #define TH_GENERIC_FILE "generic/SpatialDilatedConvolution.c"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(SpatialDilatedConvolution_shapeCheck)(
 	THTensor *input, THTensor *gradOutput,
 	THTensor *weight, THTensor *bias,
@@ -43,8 +45,8 @@ static inline void THNN_(SpatialDilatedConvolution_shapeCheck)(
   int64_t inputHeight  = input->size(dimh);
   int64_t inputWidth   = input->size(dimw);
 
-  int64_t outputHeight = (inputHeight + 2*padH - (dilationH * (kH - 1) + 1)) / dH + 1;
-  int64_t outputWidth  = (inputWidth + 2*padW - (dilationW * (kW - 1) + 1)) / dW + 1;
+  int64_t outputHeight = div_rtn<int64_t>(inputHeight + 2*padH - (dilationH * (kH - 1) + 1), dH) + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(inputWidth + 2*padW - (dilationW * (kW - 1) + 1), dW) + 1;
 
   if (outputWidth < 1 || outputHeight < 1) {
     THError("Given input size per channel: (%ld x %ld). "

diff --git a/aten/src/THNN/generic/VolumetricConvolutionMM.c b/aten/src/THNN/generic/VolumetricConvolutionMM.c
@@ -2,6 +2,8 @@
 #define TH_GENERIC_FILE "generic/VolumetricConvolutionMM.c"
 #else
 
+#include <ATen/div_rtn.h>
+
 #define CONV3D_OMP_THRESHOLD 20
 
 static void inline THNN_(VolumetricConvolutionMM_shapeCheck)(
@@ -76,9 +78,9 @@ static void inline THNN_(VolumetricConvolutionMM_shapeCheck)(
       exactInputDepth, exactInputHeight, exactInputWidth, kT, kH, kW);
   }
 
-  outputDepth  = (exactInputDepth - kT) / dT + 1;
-  outputHeight = (exactInputHeight - kH) / dH + 1;
-  outputWidth  = (exactInputWidth - kW) / dW + 1;
+  outputDepth  = div_rtn<int64_t>(exactInputDepth - kT, dT) + 1;
+  outputHeight = div_rtn<int64_t>(exactInputHeight - kH, dH) + 1;
+  outputWidth  = div_rtn<int64_t>(exactInputWidth - kW, dW) + 1;
 
 
   if (outputDepth < 1 || outputWidth < 1 || outputHeight < 1) {

diff --git a/aten/src/THNN/generic/VolumetricDilatedConvolution.c b/aten/src/THNN/generic/VolumetricDilatedConvolution.c
@@ -2,6 +2,8 @@
 #define TH_GENERIC_FILE "generic/VolumetricDilatedConvolution.c"
 #else
 
+#include <ATen/div_rtn.h>
+
 static inline void THNN_(VolumetricDilatedConvolution_shapeCheck)(
                          THTensor *input, THTensor *gradOutput,
                          THTensor *weight, THTensor *bias,
@@ -47,9 +49,9 @@ static inline void THNN_(VolumetricDilatedConvolution_shapeCheck)(
   int64_t inputDepth  = input->size(dimd);
   int64_t inputHeight  = input->size(dimh);
   int64_t inputWidth   = input->size(dimw);
-  int64_t outputDepth  = (inputDepth  + 2*padT - (dilationT * (kT - 1) + 1)) / dT + 1;
-  int64_t outputHeight = (inputHeight + 2*padH - (dilationH * (kH - 1) + 1)) / dH + 1;
-  int64_t outputWidth  = (inputWidth  + 2*padW - (dilationW * (kW - 1) + 1)) / dW + 1;
+  int64_t outputDepth  = div_rtn<int64_t>(inputDepth  + 2*padT - (dilationT * (kT - 1) + 1), dT) + 1;
+  int64_t outputHeight = div_rtn<int64_t>(inputHeight + 2*padH - (dilationH * (kH - 1) + 1), dH) + 1;
+  int64_t outputWidth  = div_rtn<int64_t>(inputWidth  + 2*padW - (dilationW * (kW - 1) + 1), dW) + 1;
 
   if (outputDepth < 1 || outputWidth < 1 || outputHeight < 1) {
     THError("Given input size per channel: (%ld x %ld x %ld). "

diff --git a/test/test_nn.py b/test/test_nn.py
@@ -712,6 +712,16 @@ def test_no_grad(self):
             self.assertFalse(output2.requires_grad)
             self.assertRaises(RuntimeError, lambda: output2.backward(torch.ones(1, 5, 10, 10)))
 
+    def test_invalid_conv2d(self):
+        module = torch.nn.Conv2d(1, 1, kernel_size=3, dilation=2, stride=2)
+        input = torch.empty(1, 1, 4, 4)
+        self.assertRaises(RuntimeError, lambda: module(input))
+
+    def test_invalid_conv3d(self):
+        module = torch.nn.Conv3d(1, 1, kernel_size=3, dilation=2, stride=2)
+        input = torch.empty(1, 1, 4, 4, 4)
+        self.assertRaises(RuntimeError, lambda: module(input))
+
     def _test_dropout(self, cls, input):
         p = 0.2
         input.fill_(1 - p)