Allowing batching for det/logdet/slogdet operations (#22909)

vishwakftw · facebook-github-bot · commit 5d130e4232aa · 2019-07-31T10:01:32.000-07:00
Summary: Changelog: - Add batching for det / logdet / slogdet operations - Update derivative computation to support batched inputs (and consequently batched outputs) - Update docs Pull Request resolved: #22909 Test Plan: - Add a `test_det_logdet_slogdet_batched` method in `test_torch.py` to test `torch.det`, `torch.logdet` and `torch.slogdet` on batched inputs. This relies on the correctness of `torch.det` on single matrices (tested by `test_det_logdet_slogdet`). A port of this test is added to `test_cuda.py` - Add autograd tests for batched inputs Differential Revision: D16580988 Pulled By: ezyang fbshipit-source-id: b76c87212fbe621f42a847e3b809b5e60cfcdb7a
diff --git a/aten/src/ATen/native/LinearAlgebra.cpp b/aten/src/ATen/native/LinearAlgebra.cpp
@@ -19,77 +19,60 @@ namespace native {
 // det(P) = \pm 1, this method returns a 3-tuple:
 //   (det(P), diag(U), info),
 // where info helps us identify singular matrices.
-static inline std::tuple<double, Tensor, int> _lu_det_P_diag_U_info(const Tensor& self) {
-  Tensor p, lu, info;
-  std::tie(lu, p, info) = at::_lu_with_info(self, /*pivot=*/true, /*check_errors=*/false);
-  int int_info = info.item<int32_t>();
-  TORCH_CHECK(int_info >= 0, "LU factorization (getrf) failed with info = ", int_info);
-  auto n = self.size(0);
-  auto num_exchanges = (at::arange(1, n + 1, p.options()) != p).nonzero().size(0);
-  if (num_exchanges % 2 == 1) {
-    return std::make_tuple(-1., lu.diag(), int_info);
-  } else {
-    return std::make_tuple(1., lu.diag(), int_info);
-  }
+static inline std::tuple<Tensor, Tensor> _lu_det_P_diag_U(const Tensor& self) {
+  Tensor pivs, lu, infos;
+  std::tie(lu, pivs, infos) = at::_lu_with_info(self, /*pivot=*/true, /*check_errors=*/false);
+  TORCH_CHECK(infos.ge(0).all().item<uint8_t>(), "Invalid argument passed to lu");
+  auto n = self.size(-1);
+  auto num_exchanges = (at::arange(1, n + 1, pivs.options()) != pivs).sum(-1, /*keepdim=*/false, /*dtype=*/self.scalar_type()).fmod_(2);
+  return std::tuple<Tensor, Tensor>(num_exchanges.mul_(-2).add_(1),
+                                    lu.diagonal(/*offset=*/0, /*dim1=*/-2, /*dim2=*/-1));
 }
 
 Tensor det(const Tensor& self) {
-  TORCH_CHECK(at::isFloatingType(self.scalar_type()) &&
-           self.dim() == 2 && self.size(0) == self.size(1),
-           "det(", self.type(), "{", self.sizes(), "}): expected a 2D square tensor "
-           "of floating types");
-  double det_P;
-  Tensor diag_U;
-  int info;
-  std::tie(det_P, diag_U, info) = _lu_det_P_diag_U_info(self);
-  if (info > 0) {
-    return at::zeros({}, self.options());
-  } else {
-    return diag_U.prod().mul_(det_P);
-  }
+  squareCheckInputs(self);
+  TORCH_CHECK(at::isFloatingType(self.scalar_type()), "Expected a floating point tensor as input");
+
+  Tensor det_P, diag_U;
+  std::tie(det_P, diag_U) = _lu_det_P_diag_U(self);
+  // complete_det is 0 when U is singular (U(i, i) = 0 for some i in [1, self.size(-1)]).
+  // The product accumulation takes care of this case, and hence no special case handling is required.
+  auto complete_det = diag_U.prod(-1).mul_(det_P);
+  return complete_det;
 }
 
 Tensor logdet(const Tensor& self) {
-  TORCH_CHECK(at::isFloatingType(self.scalar_type()) &&
-           self.dim() == 2 && self.size(0) == self.size(1),
-           "logdet(", self.type(), "{", self.sizes(), "}): expected a 2D square tensor "
-           "of floating types");
-  double det_P;
-  Tensor diag_U;
-  int info;
-  std::tie(det_P, diag_U, info) = _lu_det_P_diag_U_info(self);
-  if (info > 0) {
-    return at::full({}, -std::numeric_limits<double>::infinity(), self.options());
-  }
-  // `det_sign` is the sign of the determinant. We work on `diag_U.sign()` for
-  // numerical stability when diag_U has a lot small values.
-  auto det_sign = diag_U.sign().prod().mul_(det_P);
-  // This synchronizes on GPU, but `_lu_det_P_diag_U_info` above already synchronizes
-  if (det_sign.item<double>() <= 0) {
-    return det_sign.log_();  // get proper nan (det<0) or -inf (det=0)
-  } else {
-    return diag_U.abs_().log_().sum();
+  squareCheckInputs(self);
+  TORCH_CHECK(at::isFloatingType(self.scalar_type()), "Expected a floating point tensor as input");
+
+  Tensor det_P, diag_U;
+  std::tie(det_P, diag_U) = _lu_det_P_diag_U(self);
+  Tensor det_sign = diag_U.sign().prod(-1).mul_(det_P);
+
+  // If det_sign > 0, diag_U.abs_().log_().sum(-1) gives logdet (this means U is not singular).
+  // If det_sign <= 0, then we get proper nan (when det < 0, i.e., det_sign) or -inf (when det = 0, i.e., U is singular).
+  // U is singular when U(i, i) = 0 for some i in [1, self.size(-1)].
+  Tensor logdet_vals = diag_U.abs_().log_().sum(-1);
+  if (self.dim() > 2) {
+    logdet_vals.index_put_((det_sign < 0).nonzero_numpy(), at::full({}, NAN, self.options()));
+  } else if (det_sign.item<double>() < 0) {
+    logdet_vals.fill_(NAN);
   }
+  return logdet_vals;
 }
 
 std::tuple<Tensor, Tensor> slogdet(const Tensor& self) {
-  TORCH_CHECK(at::isFloatingType(self.scalar_type()) &&
-           self.dim() == 2 && self.size(0) == self.size(1),
-           "slogdet(", self.type(), "{", self.sizes(), "}): expected a 2D square tensor "
-           "of floating types");
-  double det_P;
-  Tensor diag_U;
-  int info;
-  std::tie(det_P, diag_U, info) = _lu_det_P_diag_U_info(self);
-  if (info > 0) {
-    return std::make_tuple(at::zeros({}, self.options()),
-                           at::full({}, -std::numeric_limits<double>::infinity(), self.options()));
-  } else {
-    // `det_sign` is the sign of the determinant. We work on `diag_U.sign()` for
-    // numerical stability when diag_U has a lot small values.
-    auto det_sign = diag_U.sign().prod().mul_(det_P);
-    return std::make_tuple(det_sign, diag_U.abs_().log_().sum());
-  }
+  squareCheckInputs(self);
+  TORCH_CHECK(at::isFloatingType(self.scalar_type()), "Expected a floating point tensor as input");
+
+  Tensor det_P, diag_U;
+  std::tie(det_P, diag_U) = _lu_det_P_diag_U(self);
+  auto det_sign = diag_U.sign().prod(-1).mul_(det_P);
+  // abslogdet_val is -inf if U is singular, in which case diag_U.abs_().log_().sum(-1) will return -inf.
+  // U is singular when U(i, i) = 0 for some i in [1, self.size(-1)].
+  // Since abslogdet_val cannot take nan, no special case handling is required.
+  auto abslogdet_val = diag_U.abs_().log_().sum(-1);
+  return std::make_tuple(det_sign, abslogdet_val);
 }
 
 Tensor pinverse(const Tensor& self, double rcond) {
diff --git a/test/common_methods_invocations.py b/test/common_methods_invocations.py
@@ -637,6 +637,13 @@ def method_tests():
         ('det', lambda: random_square_matrix_of_rank(S, 2), NO_ARGS, 'rank2', (), NO_ARGS, [skipIfNoLapack]),
         ('det', lambda: random_fullrank_matrix_distinct_singular_value(S), NO_ARGS,
          'distinct_singular_values', (), NO_ARGS, [skipIfNoLapack]),
+        ('det', (3, 3, S, S), NO_ARGS, 'batched', (), NO_ARGS, [skipIfNoLapack]),
+        ('det', (3, 3, 1, 1), NO_ARGS, 'batched_1x1', (), NO_ARGS, [skipIfNoLapack]),
+        ('det', lambda: random_symmetric_matrix(S, 3), NO_ARGS, 'batched_symmetric', (), NO_ARGS, [skipIfNoLapack]),
+        ('det', lambda: random_symmetric_psd_matrix(S, 3), NO_ARGS, 'batched_symmetric_psd', (), NO_ARGS, [skipIfNoLapack]),
+        ('det', lambda: random_symmetric_pd_matrix(S, 3), NO_ARGS, 'batched_symmetric_pd', (), NO_ARGS, [skipIfNoLapack]),
+        ('det', lambda: random_fullrank_matrix_distinct_singular_value(S, 3, 3), NO_ARGS,
+         'batched_distinct_singular_values', (), NO_ARGS, [skipIfNoLapack]),
         # For `logdet` and `slogdet`, the function at det=0 is not smooth.
         # We need to exclude tests with det=0 (e.g. dim2_null, rank1, rank2) and use
         # `make_nonzero_det` to make the random matrices have nonzero det. For
@@ -650,6 +657,14 @@ def method_tests():
          'symmetric_pd', (), NO_ARGS, [skipIfNoLapack]),
         ('logdet', lambda: make_nonzero_det(random_fullrank_matrix_distinct_singular_value(S), 1, 0), NO_ARGS,
          'distinct_singular_values', (), NO_ARGS, [skipIfNoLapack]),
+        ('logdet', lambda: make_nonzero_det(torch.randn(3, 3, S, S), 1), NO_ARGS, 'batched', (), NO_ARGS, [skipIfNoLapack]),
+        ('logdet', lambda: make_nonzero_det(torch.randn(3, 3, 1, 1), 1), NO_ARGS, 'batched_1x1', (), NO_ARGS, [skipIfNoLapack]),
+        ('logdet', lambda: make_nonzero_det(random_symmetric_matrix(S, 3), 1), NO_ARGS,
+         'batched_symmetric', (), NO_ARGS, [skipIfNoLapack]),
+        ('logdet', lambda: make_nonzero_det(random_symmetric_pd_matrix(S, 3), 1), NO_ARGS,
+         'batched_symmetric_pd', (), NO_ARGS, [skipIfNoLapack]),
+        ('logdet', lambda: make_nonzero_det(random_fullrank_matrix_distinct_singular_value(S, 3), 1, 0), NO_ARGS,
+         'batched_distinct_singular_values', (), NO_ARGS, [skipIfNoLapack]),
         ('slogdet', lambda: make_nonzero_det(torch.randn(1, 1), 1), NO_ARGS,
          '1x1_pos_det', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
         ('slogdet', lambda: make_nonzero_det(torch.randn(1, 1), -1), NO_ARGS,
@@ -664,6 +679,16 @@ def method_tests():
          'symmetric_pd', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
         ('slogdet', lambda: random_fullrank_matrix_distinct_singular_value(S), NO_ARGS,
          'distinct_singular_values', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
+        ('slogdet', lambda: make_nonzero_det(torch.randn(3, 3, 1, 1), -1), NO_ARGS,
+         'batched_1x1_neg_det', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
+        ('slogdet', lambda: make_nonzero_det(torch.randn(3, 3, S, S), 1), NO_ARGS,
+         'batched_pos_det', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
+        ('slogdet', lambda: make_nonzero_det(random_symmetric_matrix(S, 3)), NO_ARGS,
+         'batched_symmetric', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
+        ('slogdet', lambda: random_symmetric_pd_matrix(S, 3), NO_ARGS,
+         'batched_symmetric_pd', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
+        ('slogdet', lambda: random_fullrank_matrix_distinct_singular_value(S, 3), NO_ARGS,
+         'batched_distinct_singular_values', (), NO_ARGS, [skipIfNoLapack], itemgetter(1)),
         ('symeig', lambda: random_symmetric_matrix(S), (True, False), 'lower', (), NO_ARGS, [skipIfNoLapack]),
         ('symeig', lambda: random_symmetric_matrix(S), (True, True), 'upper', (), NO_ARGS, [skipIfNoLapack]),
         ('symeig', lambda: random_symmetric_matrix(M), (True, True), 'large', (), NO_ARGS, [skipIfNoLapack]),
@@ -1082,14 +1107,23 @@ def unpack_variables(args):
     'test_det_dim2_null',
     'test_det_rank1',
     'test_det_rank2',
+    'test_det_batched',
+    'test_det_batched_1x1',
+    'test_det_batched_symmetric',
+    'test_det_batched_symmetric_psd',
     # `other` expand_as(self, other) is not used in autograd.
     'test_expand_as',
     'test_logdet',
     'test_logdet_1x1',
     'test_logdet_symmetric',
+    'test_logdet_batched',
+    'test_logdet_batched_1x1',
+    'test_logdet_batched_symmetric',
     'test_slogdet_1x1_neg_det',
     'test_slogdet_neg_det',
     'test_slogdet_symmetric',
+    'test_slogdet_batched_1x1_neg_det',
+    'test_slogdet_batched_symmetric',
     'test_cdist',
 }
 
diff --git a/test/common_utils.py b/test/common_utils.py
@@ -949,30 +949,35 @@ def random_square_matrix_of_rank(l, rank):
 
 def random_symmetric_matrix(l, *batches):
     A = torch.randn(*(batches + (l, l)))
-    for i in range(l):
-        for j in range(i):
-            A[..., i, j] = A[..., j, i]
+    A = (A + A.transpose(-2, -1)).div_(2)
     return A
 
 
-def random_symmetric_psd_matrix(l):
-    A = torch.randn(l, l)
-    return A.mm(A.transpose(0, 1))
+def random_symmetric_psd_matrix(l, *batches):
+    A = torch.randn(*(batches + (l, l)))
+    return torch.matmul(A, A.transpose(-2, -1))
 
 
 def random_symmetric_pd_matrix(l, *batches):
     A = torch.randn(*(batches + (l, l)))
-    return A.matmul(A.transpose(-2, -1)) + torch.eye(l) * 1e-5
+    return torch.matmul(A, A.transpose(-2, -1)) + torch.eye(l) * 1e-5
 
 
 def make_nonzero_det(A, sign=None, min_singular_value=0.1):
     u, s, v = A.svd()
-    s[s < min_singular_value] = min_singular_value
-    A = u.mm(torch.diag(s)).mm(v.t())
-    det = A.det().item()
+    s.clamp_(min=min_singular_value)
+    A = torch.matmul(u, torch.matmul(torch.diag_embed(s), v.transpose(-2, -1)))
+    det = A.det()
     if sign is not None:
-        if (det < 0) ^ (sign < 0):
-            A[0, :].neg_()
+        if A.dim() == 2:
+            det = det.item()
+            if (det < 0) ^ (sign < 0):
+                A[0, :].neg_()
+        else:
+            cond = ((det < 0) ^ (sign < 0)).nonzero()
+            if cond.size(0) > 0:
+                for i in range(cond.size(0)):
+                    A[list(cond[i])][0, :].neg_()
     return A
 
 
diff --git a/test/test_cuda.py b/test/test_cuda.py
@@ -2220,6 +2220,10 @@ def test_chain_matmul(self):
     def test_det_logdet_slogdet(self):
         _TestTorchMixin._test_det_logdet_slogdet(self, 'cuda')
 
+    @unittest.skipIf(not TEST_MAGMA, "no MAGMA library detected")
+    def test_det_logdet_slogdet_batched(self):
+        _TestTorchMixin._test_det_logdet_slogdet_batched(self, 'cuda')
+
     @unittest.skipIf(not TEST_MAGMA, "no MAGMA library detected")
     def test_solve(self):
         _TestTorchMixin._test_solve(self, lambda t: t.cuda())
diff --git a/test/test_jit.py b/test/test_jit.py
@@ -14532,6 +14532,11 @@ def forward(self, x, y):
     'test_slogdet_pos_det',
     'test_slogdet_symmetric',
     'test_slogdet_symmetric_pd',
+    'test_slogdet_batched_1x1_neg_det',
+    'test_slogdet_batched_pos_det',
+    'test_slogdet_batched_symmetric',
+    'test_slogdet_batched_symmetric_pd',
+    'test_slogdet_batched_distinct_singular_values'
 }
 
 # known to be failing in script
diff --git a/test/test_torch.py b/test/test_torch.py
@@ -6496,6 +6496,59 @@ def get_random_mat_scale(n):
     def test_det_logdet_slogdet(self):
         self._test_det_logdet_slogdet(self, 'cpu')
 
+    @staticmethod
+    def _test_det_logdet_slogdet_batched(self, device):
+        from common_utils import (random_symmetric_matrix, random_symmetric_psd_matrix,
+                                  random_symmetric_pd_matrix, random_square_matrix_of_rank)
+
+        # mat_chars denotes matrix characteristics
+        # possible values are: sym, sym_psd, sym_pd, sing, non_sym
+        def run_test(matsize, batchdims, mat_chars):
+            num_matrices = reduce(lambda x, y: x * y, batchdims, 1)
+            list_of_matrices = []
+
+            for idx in range(num_matrices):
+                mat_type = idx % len(mat_chars)
+                if mat_chars[mat_type] == 'sym':
+                    list_of_matrices.append(random_symmetric_matrix(matsize).to(device=device))
+                elif mat_chars[mat_type] == 'sym_psd':
+                    list_of_matrices.append(random_symmetric_psd_matrix(matsize).to(device=device))
+                elif mat_chars[mat_type] == 'sym_pd':
+                    list_of_matrices.append(random_symmetric_pd_matrix(matsize).to(device=device))
+                elif mat_chars[mat_type] == 'sing':
+                    list_of_matrices.append(random_square_matrix_of_rank(matsize, matsize // 2).to(device=device))
+                elif mat_chars[mat_type] == 'non_sing':
+                    list_of_matrices.append(random_square_matrix_of_rank(matsize, matsize).to(device=device))
+            full_tensor = torch.stack(list_of_matrices, dim=0).reshape(batchdims + (matsize, matsize))
+            # Scaling adapted from `get_random_mat_scale` in _test_det_logdet_slogdet
+            full_tensor *= (math.factorial(matsize - 1) ** (-1.0 / (2 * matsize)))
+
+            for fn in [torch.det, torch.logdet, torch.slogdet]:
+                expected_value = []
+                actual_value = fn(full_tensor)
+                for full_idx in product(*map(lambda x: list(range(x)), batchdims)):
+                    expected_value.append(fn(full_tensor[full_idx]))
+
+                if fn == torch.slogdet:
+                    sign_value = torch.stack([tup[0] for tup in expected_value], dim=0).reshape(batchdims)
+                    expected_value = torch.stack([tup[1] for tup in expected_value], dim=0).reshape(batchdims)
+                    self.assertEqual(sign_value, actual_value[0], allow_inf=True)
+                    self.assertEqual(expected_value, actual_value[1], allow_inf=True)
+                else:
+                    expected_value = torch.stack(expected_value, dim=0).reshape(batchdims)
+                    self.assertEqual(actual_value, expected_value, allow_inf=True)
+
+        for matsize, batchdims in product([3, 5], [(3,), (5, 3)]):
+            run_test(matsize, batchdims, mat_chars=['sym_pd'])
+            run_test(matsize, batchdims, mat_chars=['sing'])
+            run_test(matsize, batchdims, mat_chars=['non_sing'])
+            run_test(matsize, batchdims, mat_chars=['sym', 'sym_pd', 'sym_psd'])
+            run_test(matsize, batchdims, mat_chars=['sing', 'non_sing'])
+
+    @skipIfNoLapack
+    def test_det_logdet_slogdet_batched(self):
+        self._test_det_logdet_slogdet_batched(self, 'cpu')
+
     @staticmethod
     def _test_fft_ifft_rfft_irfft(self, device='cpu'):
         def _test_complex(sizes, signal_ndim, prepro_fn=lambda x: x):
diff --git a/tools/autograd/templates/Functions.cpp b/tools/autograd/templates/Functions.cpp
diff --git a/torch/_torch_docs.py b/torch/_torch_docs.py