pytorch
diff --git a/‎test/nn/test_module_hooks.py‎
Lines changed: 185 additions & 10 deletions b/‎test/nn/test_module_hooks.py‎
Lines changed: 185 additions & 10 deletions
diff --git a/‎torch/distributed/nn/api/remote_module.py‎
Lines changed: 4 additions & 0 deletions b/‎torch/distributed/nn/api/remote_module.py‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎torch/jit/_recursive.py‎
Lines changed: 2 additions & 0 deletions b/‎torch/jit/_recursive.py‎
Lines changed: 2 additions & 0 deletions
@@ -9,7 +9,7 @@
 import torch.nn as nn
 
 from functools import partial
-from typing import List, Tuple
+from typing import Any, Dict, List, Tuple
 
 
 class Net(nn.Module):
@@ -87,8 +87,64 @@ def full_backward_pre_hook(
     self.assertEqual(len(grad_input), 1)
 
 
-class TestModuleHooks(TestCase):
+class KwargModel(nn.Module):
+    def __init__(self) -> None:
+        super().__init__()
+        self.net1 = Net()
+        self.net2 = Net()
+
+    def forward(
+        self, x: torch.Tensor, bias: torch.Tensor = None
+    ) -> torch.Tensor:
+        if bias is not None:
+            x = x + bias
+        return x
+
+    def internal_forward_hook(
+        self,
+        module: nn.Module,
+        args: Tuple[torch.Tensor],
+        kwargs: Dict[str, Any],
+        out: torch.Tensor,
+    ):
+        return out + kwargs["bias"]
+
+
+def kwarg_forward_pre_hook(
+    self: TestCase,
+    fired_hooks: List[int],
+    expected_module: nn.Module,
+    hook_id: int,
+    module: nn.Module,
+    args: Tuple[torch.Tensor],
+    kwargs: Dict[str, Any],
+) -> Tuple[Any, Any]:
+    fired_hooks.append(hook_id)
+    self.assertEqual(id(module), id(expected_module))
+    self.assertEqual(len(args), 1)
+    kwargs["bias"] = 2 * kwargs["bias"]
+    return args, kwargs
+
+
+def kwarg_forward_hook(
+    self: TestCase,
+    fired_hooks: List[int],
+    expected_module: nn.Module,
+    hook_id: int,
+    module: nn.Module,
+    args: Tuple[torch.Tensor],
+    kwargs: Dict[str, Any],
+    out: torch.Tensor,
+) -> Any:
+    fired_hooks.append(hook_id)
+    self.assertEqual(id(module), id(expected_module))
+    self.assertEqual(len(args), 1)
+
+    out = out + kwargs["bias"]
+    return out
 
+
+class TestModuleHooks(TestCase):
     @skipIfTorchDynamo("Dynamo does not yet capture hooks")
     def test_forward_hooks(self):
         fired_hooks: List[int] = []
@@ -116,11 +172,15 @@ def test_forward_pre_hooks(self):
         model = ToyModel()
         x = torch.randn(10, 10)
         hook = partial(forward_pre_hook, self, fired_hooks, model.net2.seq1)
-        model.net2.seq1.register_forward_pre_hook(partial(hook, 0), prepend=True)
+        model.net2.seq1.register_forward_pre_hook(
+            partial(hook, 0), prepend=True
+        )
         model.net2.seq1.register_forward_pre_hook(partial(hook, 1))
         model.net2.seq1.register_forward_pre_hook(partial(hook, 2))
         model.net2.seq1.register_forward_pre_hook(partial(hook, 3))
-        model.net2.seq1.register_forward_pre_hook(partial(hook, 4), prepend=True)
+        model.net2.seq1.register_forward_pre_hook(
+            partial(hook, 4), prepend=True
+        )
         expected = [4, 0, 1, 2, 3]
 
         self.assertEqual(fired_hooks, [])
@@ -158,8 +218,12 @@ def test_full_backward_pre_hooks(self):
         model = ToyModel()
         x = torch.randn(10, 10)
         hook = partial(full_backward_pre_hook, self, fired_hooks, model.net1)
-        model.net1.register_full_backward_pre_hook(partial(hook, 0), prepend=True)
-        model.net1.register_full_backward_pre_hook(partial(hook, 1), prepend=True)
+        model.net1.register_full_backward_pre_hook(
+            partial(hook, 0), prepend=True
+        )
+        model.net1.register_full_backward_pre_hook(
+            partial(hook, 1), prepend=True
+        )
         model.net1.register_full_backward_pre_hook(partial(hook, 2))
         model.net1.register_full_backward_pre_hook(partial(hook, 3))
         model.net1.register_full_backward_pre_hook(partial(hook, 4))
@@ -178,10 +242,18 @@ def test_mixed_hooks(self):
         fired_hooks: List[int] = []
         model = ToyModel()
         x = torch.randn(10, 10)
-        model.register_forward_pre_hook(partial(forward_pre_hook, self, fired_hooks, model, 0))
-        model.register_forward_hook(partial(forward_hook, self, fired_hooks, model, 1))
-        model.register_full_backward_pre_hook(partial(full_backward_pre_hook, self, fired_hooks, model, 2))
-        model.register_full_backward_hook(partial(full_backward_hook, self, fired_hooks, model, 3))
+        model.register_forward_pre_hook(
+            partial(forward_pre_hook, self, fired_hooks, model, 0)
+        )
+        model.register_forward_hook(
+            partial(forward_hook, self, fired_hooks, model, 1)
+        )
+        model.register_full_backward_pre_hook(
+            partial(full_backward_pre_hook, self, fired_hooks, model, 2)
+        )
+        model.register_full_backward_hook(
+            partial(full_backward_hook, self, fired_hooks, model, 3)
+        )
 
         self.assertEqual(fired_hooks, [])
         out = model(x)
@@ -191,6 +263,109 @@ def test_mixed_hooks(self):
         model(x).sum().backward()
         self.assertEqual(fired_hooks, [0, 1, 2, 3, 0, 1, 2, 3])
 
+    @skipIfTorchDynamo("Dynamo does not yet capture hooks")
+    def test_kwarg_hooks(self):
+        # 1. test forward pre hook
+        fired_hooks: List[int] = []
+        x: torch.Tensor = torch.ones(10, 10)
+        bias: torch.Tensor = torch.ones(10, 10)
+        model = KwargModel()
+        model.register_forward_pre_hook(
+            partial(kwarg_forward_pre_hook, self, fired_hooks, model, 0),
+            with_kwargs=True,
+        )
+
+        # forward-pre: bias' = bias * 2
+        # So, out = x + bias * 2
+        self.assertEqual(fired_hooks, [])
+        out = model(x, bias=bias)
+        self.assertEqual(fired_hooks, [0])
+        self.assertEqual(out, x + 2 * bias, rtol=0, atol=1e-5)
+
+        # 2. test forward pre and forward hooks
+        fired_hooks: List[int] = []
+        x: torch.Tensor = torch.ones(10, 10)
+        bias: torch.Tensor = torch.ones(10, 10)
+        model = KwargModel()
+        model.register_forward_hook(
+            partial(kwarg_forward_hook, self, fired_hooks, model, 1),
+            with_kwargs=True,
+        )
+        model.register_forward_pre_hook(
+            partial(kwarg_forward_pre_hook, self, fired_hooks, model, 0),
+            with_kwargs=True,
+        )
+
+        # forward-pre: bias' = bias * 2
+        # forward: out = x + bias'
+        # forward-post: out = out + bias'
+        # So, out = x + bias * 4
+        self.assertEqual(fired_hooks, [])
+        out = model(x, bias=bias)
+        self.assertEqual(fired_hooks, [0, 1])
+        self.assertEqual(out, x + 4 * bias, rtol=0, atol=1e-5)
+
+        # 3. test nn.Module member method as forward-post hook
+        x: torch.Tensor = torch.ones(10, 10)
+        bias: torch.Tensor = torch.ones(10, 10)
+        model = KwargModel()
+        model.register_forward_hook(
+            model.internal_forward_hook, with_kwargs=True
+        )
+
+        # forward: out = x + bias
+        # forward-post: out = out + bias
+        # So, out = x + bias * 2
+        out = model(x, bias=bias)
+        self.assertEqual(out, x + 2 * bias, rtol=0, atol=1e-5)
+
+
+    @skipIfTorchDynamo("Dynamo does not yet capture hooks")
+    def test_remove_kwarg_hooks(self):
+        # test forward pre and forward hooks
+        fired_hooks: List[int] = []
+        x: torch.Tensor = torch.ones(10, 10)
+        bias: torch.Tensor = torch.ones(10, 10)
+        model = KwargModel()
+        forward_hook_handle = model.register_forward_hook(
+            partial(kwarg_forward_hook, self, fired_hooks, model, 1),
+            with_kwargs=True,
+        )
+        forward_pre_hook_handle = model.register_forward_pre_hook(
+            partial(kwarg_forward_pre_hook, self, fired_hooks, model, 0),
+            with_kwargs=True,
+        )
+
+        # forward-pre: bias' = bias * 2
+        # forward: out = x + bias'
+        # forward-post: out = out + bias'
+        # So, out = x + bias * 4
+        self.assertEqual(fired_hooks, [])
+        out = model(x, bias=bias)
+        self.assertEqual(fired_hooks, [0, 1])
+        self.assertEqual(out, x + 4 * bias, rtol=0, atol=1e-5)
+
+        # forward-pre: bias' = bias * 2
+        # forward: out = x + bias'
+        # So, out = x + bias * 2
+        forward_hook_handle.remove()
+        out = model(x, bias=bias)
+        self.assertEqual(fired_hooks, [0, 1, 0])
+        self.assertEqual(out, x + 2 * bias, rtol=0, atol=1e-5)
+        self.assertFalse(
+            forward_hook_handle.id in model._forward_hooks_with_kwargs
+        )
+
+        # forward: out = x + bias
+        # So, out = x + bias
+        forward_pre_hook_handle.remove()
+        out = model(x, bias=bias)
+        self.assertEqual(fired_hooks, [0, 1, 0])
+        self.assertEqual(out, x + bias, rtol=0, atol=1e-5)
+        self.assertFalse(
+            forward_pre_hook_handle.id in model._forward_pre_hooks_with_kwargs
+        )
+
 
 if __name__ == "__main__":
     run_tests()
@@ -64,7 +64,9 @@
     "_backward_pre_hooks",
     "_is_full_backward_hook",
     "_forward_hooks",
+    "_forward_hooks_with_kwargs",
     "_forward_pre_hooks",
+    "_forward_pre_hooks_with_kwargs",
     "_state_dict_hooks",
     "_load_state_dict_pre_hooks",
     "_load_state_dict_post_hooks",
@@ -365,13 +367,15 @@ def register_forward_pre_hook(  # type: ignore[return]
         self,
         hook: Callable[..., None],
         prepend: bool = False,
+        with_kwargs: bool = False,
     ) -> RemovableHandle:
         _raise_not_supported(self.register_forward_pre_hook.__name__)
 
     def register_forward_hook(  # type: ignore[return]
         self,
         hook: Callable[..., None],
         prepend: bool = False,
+        with_kwargs: bool = False,
     ) -> RemovableHandle:
         _raise_not_supported(self.register_forward_hook.__name__)
 
 
@@ -30,7 +30,9 @@
     "_backward_hooks",
     "_backward_pre_hooks",
     "_forward_hooks",
+    "_forward_hooks_with_kwargs",
     "_forward_pre_hooks",
+    "_forward_pre_hooks_with_kwargs",
     "_state_dict_hooks",
     "_load_state_dict_pre_hooks",
     "_load_state_dict_post_hooks",