attackgithub
diff --git a/‎src/TensorFlowNET.Core/Framework/IndexedSlices.cs‎
Lines changed: 17 additions & 1 deletion b/‎src/TensorFlowNET.Core/Framework/IndexedSlices.cs‎
Lines changed: 17 additions & 1 deletion
diff --git a/‎src/TensorFlowNET.Core/Gradients/array_grad.cs‎
Lines changed: 4 additions & 4 deletions b/‎src/TensorFlowNET.Core/Gradients/array_grad.cs‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎src/TensorFlowNET.Core/Gradients/gradients_util.cs‎
Lines changed: 39 additions & 4 deletions b/‎src/TensorFlowNET.Core/Gradients/gradients_util.cs‎
Lines changed: 39 additions & 4 deletions
diff --git a/‎src/TensorFlowNET.Core/Operations/array_ops.py.cs‎
Lines changed: 3 additions & 0 deletions b/‎src/TensorFlowNET.Core/Operations/array_ops.py.cs‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/TensorFlowNET.Core/Operations/gen_array_ops.cs‎
Lines changed: 42 additions & 0 deletions b/‎src/TensorFlowNET.Core/Operations/gen_array_ops.cs‎
Lines changed: 42 additions & 0 deletions
diff --git a/‎src/TensorFlowNET.Core/Operations/gen_math_ops.cs‎
Lines changed: 27 additions & 0 deletions b/‎src/TensorFlowNET.Core/Operations/gen_math_ops.cs‎
Lines changed: 27 additions & 0 deletions
diff --git a/‎src/TensorFlowNET.Core/Operations/math_ops.cs‎
Lines changed: 16 additions & 2 deletions b/‎src/TensorFlowNET.Core/Operations/math_ops.cs‎
Lines changed: 16 additions & 2 deletions
diff --git a/‎src/TensorFlowNET.Core/TensorFlowNET.Core.csproj‎
Lines changed: 10 additions & 5 deletions b/‎src/TensorFlowNET.Core/TensorFlowNET.Core.csproj‎
Lines changed: 10 additions & 5 deletions
diff --git a/‎src/TensorFlowNET.Core/Train/AdamOptimizer.cs‎
Lines changed: 52 additions & 3 deletions b/‎src/TensorFlowNET.Core/Train/AdamOptimizer.cs‎
Lines changed: 52 additions & 3 deletions
@@ -11,10 +11,26 @@ public class IndexedSlices : CompositeTensor
     {
         Tensor _values;
         public Tensor values => _values;
+        Tensor _indices;
+        public Tensor indices => _indices;
+        Tensor _dense_shape;
+        public Tensor dense_shape => _dense_shape;
+
+        public string name => _values.name;
+
+        public string device => _values.Device;
+
+        public Operation op => _values.op;
+
+        public TF_DataType dtype => _values.dtype;
+
+        public Graph graph => _values.graph;
 
         public IndexedSlices(Tensor values, Tensor indices, Tensor dense_shape = null)
         {
-
+            _values = values;
+            _indices = indices;
+            _dense_shape = dense_shape;
         }
 
         public static implicit operator Tensor(IndexedSlices indexedSlices)
 
@@ -83,13 +83,13 @@ there will be a small number of performance regressions.*/
                         new Tensor[] { non_neg_concat_dim, tf.constant(0) },
                         new Tensor[] { tf.constant(1), tf.constant(-1) });
                 var squeeze_sizes = array_ops.squeeze(slice);
-                out_grads = gen_ops.split(grad, squeeze_sizes, non_neg_concat_dim).ToList();
+                out_grads = gen_array_ops.split(grad, squeeze_sizes, non_neg_concat_dim).ToList();
             }
             else
             {
-                var offset = gen_ops.concat_offset(non_neg_concat_dim, sizes);
+                var offset = gen_array_ops.concat_offset(non_neg_concat_dim, sizes);
                 foreach (var (begin, size) in zip(offset, sizes))
-                    out_grads.Add(gen_ops.slice(grad, begin, size));
+                    out_grads.Add(gen_array_ops.slice(grad, begin, size));
             }
 
             return (end_value_index <= dim_index ? 
@@ -129,7 +129,7 @@ private static Tensor[] _ExtractInputShapes(Tensor[] inputs)
             if (fully_known)
                 return sizes;
             else
-                return gen_ops.shape_n(inputs);
+                return gen_array_ops.shape_n(inputs);
         }
 
         /// <summary>
 
@@ -93,10 +93,7 @@ public static Tensor[] _GradientsHelper(Tensor[] ys,
                     {
                         // generate gradient subgraph for op.
                         var op = queue.Dequeue();
-                        if(op.name == "embedding/ExpandDims")
-                        {
 
-                        }
                         _maybe_colocate_with(op, gradient_uid, colocate_gradients_with_ops);
                         //if (loop_state != null)
                         //loop_state.EnterGradWhileContext(op, before: true);
@@ -311,16 +308,22 @@ private static Tensor[] _AggregatedGrads(Dictionary<string, List<List<Tensor>>>
                 // Aggregate multiple gradients, and convert [] to None.
                 if (out_grad.Count > 0)
                 {
+                    string used = "";
                     if (out_grad.Count < 2)
                     {
-                        string used = "nop";
+                        used = "nop";
                         if (out_grad.Count == 0)
                         {
                             throw new ValueError("_AggregatedGrads out_grad.Length == 0");
                         }
 
                         return_grads[i] = out_grad[0];
                     }
+                    else
+                    {
+                        used = "add_n";
+                        out_grads[i] = new List<Tensor> { _MultiDeviceAddN(out_grad.ToArray(), gradient_uid) };
+                    }
                 }
                 else
                 {
@@ -331,6 +334,38 @@ private static Tensor[] _AggregatedGrads(Dictionary<string, List<List<Tensor>>>
             return return_grads;
         }
 
+        /// <summary>
+        /// Adds tensors from potentially multiple devices.
+        /// </summary>
+        /// <param name="tensor_list"></param>
+        /// <param name="gradient_uid"></param>
+        /// <returns></returns>
+        private static Tensor _MultiDeviceAddN(Tensor[] tensor_list, string gradient_uid)
+        {
+            // Basic function structure comes from control_flow_ops.group().
+            // Sort tensors according to their devices.
+            var tensors_on_device = new Dictionary<string, List<Tensor>>();
+            
+            foreach (var tensor in tensor_list)
+            {
+                if (!tensors_on_device.ContainsKey(tensor.Device))
+                    tensors_on_device[tensor.Device] = new List<Tensor>();
+
+                tensors_on_device[tensor.Device].Add(tensor);
+            }
+                
+            // For each device, add the tensors on that device first.
+            var summands = new List<Tensor>();
+            foreach(var dev in tensors_on_device.Keys)
+            {
+                var tensors = tensors_on_device[dev];
+                ops._colocate_with_for_gradient(tensors[0].op, gradient_uid, ignore_existing: true);
+                summands.Add(math_ops.add_n(tensors.ToArray()));
+            }
+
+            return math_ops.add_n(summands.ToArray());
+        }
+
         /// <summary>
         /// The set of ops that terminate the gradient computation.
         /// </summary>
 
@@ -276,6 +276,9 @@ public static Tensor one_hot(Tensor indices, int depth,
             });
         }
 
+        public static (Tensor, Tensor) unique(Tensor x, TF_DataType out_idx = TF_DataType.TF_INT32, string name = null)
+            => gen_array_ops.unique(x, out_idx: out_idx, name: name);
+
         public static Tensor where(Tensor condition, object x = null, object y = null, string name = null)
         {
             if( x == null && y == null)
 
@@ -26,6 +26,13 @@ public static Tensor concat_v2(Tensor[] values, int axis, string name = null)
             return _op.outputs[0];
         }
 
+        public static Tensor[] concat_offset(Tensor concat_dim, Tensor[] shape, string name = null)
+        {
+            var _op = _op_def_lib._apply_op_helper("ConcatOffset", name: name, args: new { concat_dim, shape });
+
+            return _op.outputs;
+        }
+
         /// <summary>
         ///    Returns a diagonal tensor with a given diagonal values.
         /// </summary>
@@ -205,6 +212,21 @@ public static Tensor reshape(Tensor tensor, int[] shape, string name = null)
             return _op.outputs[0];
         }
 
+        /// <summary>
+        /// Finds unique elements in a 1-D tensor.
+        /// </summary>
+        /// <param name="x"></param>
+        /// <param name="out_idx"></param>
+        /// <param name="name"></param>
+        /// <returns></returns>
+        public static (Tensor, Tensor) unique(Tensor x, TF_DataType out_idx = TF_DataType.TF_INT32, string name = null)
+        {
+            var _op = _op_def_lib._apply_op_helper("Unique", name, new { x, out_idx });
+            // TODO
+            throw new NotImplementedException("_result = _UniqueOutput._make(_result)");
+            // return _op.outputs[0];
+        }
+
         public static Tensor where()
         {
             throw new NotImplementedException("where");
@@ -271,6 +293,26 @@ public static Tensor size(Tensor input, TF_DataType out_type = TF_DataType.TF_IN
             return _op.outputs[0];
         }
 
+        /// <summary>
+        /// Return a slice from 'input'
+        /// </summary>
+        /// <param name="input"></param>
+        /// <param name="begin"></param>
+        /// <param name="size"></param>
+        /// <param name="name"></param>
+        /// <returns></returns>
+        public static Tensor slice(Tensor input, Tensor begin, Tensor size, string name = null)
+        {
+            var _op = _op_def_lib._apply_op_helper("Slice", name, new { input, begin, size });
+            return _op.outputs[0];
+        }
+
+        public static Tensor[] split(Tensor axis, Tensor value, int num_split, string name = null)
+        {
+            var _op = _op_def_lib._apply_op_helper("Split", name, new { split_dim = axis, value, num_split });
+            return _op.outputs;
+        }
+
         public static Tensor tile(Tensor input, Tensor multiples, string name = null)
         {
             var _op = _op_def_lib._apply_op_helper("Tile", name, new { input, multiples });
 
@@ -16,6 +16,19 @@ public static Tensor _all(Tensor input, Tensor axis, bool keep_dims = false, str
             return _op.outputs[0];
         }
 
+        /// <summary>
+        /// Add all input tensors element wise.
+        /// </summary>
+        /// <param name="inputs"></param>
+        /// <param name="name"></param>
+        /// <returns></returns>
+        public static Tensor add_n(Tensor[] inputs, string name = null)
+        {
+            var _op = _op_def_lib._apply_op_helper("AddN", name, args: new { inputs });
+
+            return _op.outputs[0];
+        }
+
         /// <summary>
         /// Returns the index with the largest value across dimensions of a tensor.
         /// </summary>
@@ -198,6 +211,20 @@ public static Tensor cosh(Tensor x, string name = null)
             return _op.outputs[0];
         }
 
+        /// <summary>
+        /// Computes the sum along segments of a tensor.
+        /// </summary>
+        /// <param name="data"></param>
+        /// <param name="segment_ids"></param>
+        /// <param name="num_segments"></param>
+        /// <param name="name"></param>
+        /// <returns></returns>
+        public static Tensor unsorted_segment_sum(Tensor data, Tensor segment_ids, Tensor num_segments, string name = null)
+        {
+            var _op = _op_def_lib._apply_op_helper("UnsortedSegmentSum", name, new { data, segment_ids, num_segments });
+            return _op.outputs[0];
+        }
+
         public static Tensor tan(Tensor x, string name = null)
         {
             var _op = _op_def_lib._apply_op_helper("Tan", name, args: new { x });
 
@@ -44,8 +44,8 @@ public static Tensor add_n(Tensor[] inputs, string name = null)
                     return array_ops.identity(values, name: name);
                 return values;
             }
-            throw new NotImplementedException("math_ops add_n n > 1");
-            // return gen_math_ops.add_n(inputs, name: name);
+            
+            return gen_math_ops.add_n(inputs, name: name);
         }
 
         public static Tensor cast(Tensor x, TF_DataType dtype = TF_DataType.DtInvalid, string name = null)
@@ -126,6 +126,9 @@ public static Tensor div_no_nan(Tensor x, Tensor y, string name = null)
         public static Tensor equal<Tx, Ty>(Tx x, Ty y, string name = null)
             => gen_math_ops.equal(x, y, name: name);
 
+        public static Tensor sqrt(Tensor x, string name = null)
+            => gen_math_ops.sqrt(x, name: name);
+
         public static Tensor multiply<Tx, Ty>(Tx x, Ty y, string name = null)
             => gen_math_ops.mul(x, y, name: name);
 
@@ -319,6 +322,17 @@ public static Tensor reduce_min(Tensor input_tensor, int[] axis = null, bool kee
             return _may_reduce_to_scalar(keepdims, axis, min);
         }
 
+        /// <summary>
+        /// Computes the sum along segments of a tensor.
+        /// </summary>
+        /// <param name="data"></param>
+        /// <param name="segment_ids"></param>
+        /// <param name="num_segments"></param>
+        /// <param name="name"></param>
+        /// <returns></returns>
+        public static Tensor unsorted_segment_sum(Tensor data, Tensor segment_ids, Tensor num_segments, string name = null)
+            => gen_math_ops.unsorted_segment_sum(data, segment_ids, num_segments, name: name);
+        
         /// <summary>
         /// Casts a tensor to type `int32`.
         /// </summary>
 
@@ -5,10 +5,10 @@
     <AssemblyName>TensorFlow.NET</AssemblyName>
     <RootNamespace>Tensorflow</RootNamespace>
     <TargetTensorFlow>1.14.0</TargetTensorFlow>
-    <Version>0.8.1</Version>
+    <Version>0.8.2</Version>
     <Authors>Haiping Chen</Authors>
     <Company>SciSharp STACK</Company>
-    <GeneratePackageOnBuild>true</GeneratePackageOnBuild>
+    <GeneratePackageOnBuild>false</GeneratePackageOnBuild>
     <Copyright>Apache 2.0</Copyright>
     <RepositoryUrl>https://github.com/SciSharp/TensorFlow.NET</RepositoryUrl>
     <RepositoryType>git</RepositoryType>
@@ -17,14 +17,15 @@
     <PackageTags>TensorFlow, NumSharp, SciSharp, MachineLearning, TensorFlow.NET, C#</PackageTags>
     <Description>Google's TensorFlow full binding in .NET Standard.
 Docs: https://tensorflownet.readthedocs.io</Description>
-    <AssemblyVersion>0.8.1.0</AssemblyVersion>
+    <AssemblyVersion>0.8.2.0</AssemblyVersion>
     <PackageReleaseNotes>Changes since v0.8:
 
 1. Remove global static graph instance.
 2. Provide custom gradient function.
-3. Add gradient function for Conv2D.</PackageReleaseNotes>
+3. Add gradient function for Conv2D.
+4. Fix bug for Transfer Learning example.</PackageReleaseNotes>
     <LangVersion>7.2</LangVersion>
-    <FileVersion>0.8.1.0</FileVersion>
+    <FileVersion>0.8.2.0</FileVersion>
   </PropertyGroup>
 
   <PropertyGroup Condition="'$(Configuration)|$(Platform)'=='Debug|AnyCPU'">
@@ -42,6 +43,10 @@ Docs: https://tensorflownet.readthedocs.io</Description>
     <None Remove="runtimes\**" />
   </ItemGroup>
 
+  <ItemGroup>
+    <Compile Remove="Operations\gen_ops.cs" />
+  </ItemGroup>
+
   <ItemGroup>
     <None Remove="Protobuf\README.md" />
   </ItemGroup>
 
@@ -1,6 +1,8 @@
 using System;
 using System.Collections.Generic;
 using System.Text;
+using Tensorflow.Framework;
+using static Tensorflow.Python;
 
 namespace Tensorflow.Train
 {
@@ -10,9 +12,10 @@ namespace Tensorflow.Train
     /// </summary>
     public class AdamOptimizer : Optimizer
     {
-        private float _beta1;
-        private float _beta2;
-        private float _epsilon;
+        float _beta1;
+        float _beta2;
+        float _epsilon;
+        Tensor _lr_t, _beta1_t, _beta2_t, _epsilon_t;
 
         public AdamOptimizer(float learning_rate, float beta1 = 0.9f, float beta2 = 0.999f, float epsilon = 1e-8f, bool use_locking = false, string name = "Adam")
             : base(learning_rate, use_locking, name)
@@ -21,5 +24,51 @@ public AdamOptimizer(float learning_rate, float beta1 = 0.9f, float beta2 = 0.99
             _beta2 = beta2;
             _epsilon = epsilon;
         }
+
+        public override Operation _apply_sparse(IndexedSlices grad, RefVariable var)
+        {
+            return _apply_sparse_shared(grad.values, var, grad.indices, (x, i, v) =>
+            {
+                return state_ops.scatter_add(x, i, v, use_locking: _use_locking);
+            });
+        }
+
+        private Operation _apply_sparse_shared(Tensor grad, RefVariable var, Tensor indices, Func<RefVariable, Tensor, Tensor, Tensor> scatter_add)
+        {
+            var (beta1_power_v, beta2_power_v) = _get_beta_accumulators();
+            Tensor beta1_power = math_ops.cast(beta1_power_v, var.dtype.as_base_dtype());
+            Tensor beta2_power = math_ops.cast(beta2_power_v, var.dtype.as_base_dtype());
+            var lr_t = math_ops.cast(_lr_t, var.dtype.as_base_dtype());
+            var beta1_t = math_ops.cast(_beta1_t, var.dtype.as_base_dtype());
+            var beta2_t = math_ops.cast(_beta2_t, var.dtype.as_base_dtype());
+            var epsilon_t = math_ops.cast(_epsilon_t, var.dtype.as_base_dtype());
+            var lr = (lr_t * math_ops.sqrt(1 - beta2_power) / (1 - beta1_power));
+            var m = get_slot(var, "m");
+            var m_scaled_g_values = grad * (1 - beta1_t);
+            var m_t = state_ops.assign(m, m * beta1_t, use_locking: _use_locking);
+            with(ops.control_dependencies(new[] { m_t }), delegate
+            {
+                m_t = scatter_add(m, indices, m_scaled_g_values);
+            });
+
+            var v = get_slot(var, "v");
+            var v_scaled_g_values = (grad * grad) * (1 - beta2_t);
+            var v_t = state_ops.assign(v, v * beta2_t, use_locking: _use_locking);
+            with(ops.control_dependencies(new[] { v_t }), delegate
+            {
+                v_t = scatter_add(v, indices, v_scaled_g_values);
+            });
+            var v_sqrt = math_ops.sqrt(v_t);
+            var var_update = state_ops.assign_sub(var, lr * m_t / (v_sqrt + epsilon_t), use_locking: _use_locking);
+            return control_flow_ops.group(new[] { var_update, m_t, v_t });
+        }
+
+        private (RefVariable, RefVariable) _get_beta_accumulators()
+        {
+            ops.init_scope();
+            var graph = ops.get_default_graph();
+            return (_get_non_slot_variable("beta1_power", graph: graph),
+                _get_non_slot_variable("beta2_power", graph: graph));
+        }
     }
 }
Original file line number	Diff line number	Diff line change
`@@ -83,13 +83,13 @@ there will be a small number of performance regressions.*/`
`83`	`83`	`new Tensor[] { non_neg_concat_dim, tf.constant(0) },`
`84`	`84`	`new Tensor[] { tf.constant(1), tf.constant(-1) });`
`85`	`85`	`var squeeze_sizes = array_ops.squeeze(slice);`
`86`		`- out_grads = gen_ops.split(grad, squeeze_sizes, non_neg_concat_dim).ToList();`
	`86`	`+ out_grads = gen_array_ops.split(grad, squeeze_sizes, non_neg_concat_dim).ToList();`
`87`	`87`	`}`
`88`	`88`	`else`
`89`	`89`	`{`
`90`		`- var offset = gen_ops.concat_offset(non_neg_concat_dim, sizes);`
	`90`	`+ var offset = gen_array_ops.concat_offset(non_neg_concat_dim, sizes);`
`91`	`91`	`foreach (var (begin, size) in zip(offset, sizes))`
`92`		`- out_grads.Add(gen_ops.slice(grad, begin, size));`
	`92`	`+ out_grads.Add(gen_array_ops.slice(grad, begin, size));`
`93`	`93`	`}`
`94`	`94`
`95`	`95`	`return (end_value_index <= dim_index ?`
`@@ -129,7 +129,7 @@ private static Tensor[] _ExtractInputShapes(Tensor[] inputs)`
`129`	`129`	`if (fully_known)`
`130`	`130`	`return sizes;`
`131`	`131`	`else`
`132`		`- return gen_ops.shape_n(inputs);`
	`132`	`+ return gen_array_ops.shape_n(inputs);`
`133`	`133`	`}`
`134`	`134`
`135`	`135`	`/// <summary>`
Original file line number	Diff line number	Diff line change
`@@ -276,6 +276,9 @@ public static Tensor one_hot(Tensor indices, int depth,`
`276`	`276`	`});`
`277`	`277`	`}`
`278`	`278`
	`279`	`+ public static (Tensor, Tensor) unique(Tensor x, TF_DataType out_idx = TF_DataType.TF_INT32, string name = null)`
	`280`	`+ => gen_array_ops.unique(x, out_idx: out_idx, name: name);`
	`281`	`+`
`279`	`282`	`public static Tensor where(Tensor condition, object x = null, object y = null, string name = null)`
`280`	`283`	`{`
`281`	`284`	`if( x == null && y == null)`