Revamped learning code

matthewlai · matthewlai · commit 97333edca12c · 2015-12-09T22:01:29.000-08:00
diff --git a/ann/ann.h b/ann/ann.h
@@ -172,6 +172,8 @@ class FCANN
 
 	void UpdateWeightSemiSparse_();
 
+	void InitializeOptimizationState_();
+
 	// this is used to ensure network stability
 	constexpr static FP MAX_WEIGHT = 1000.0f;
 
diff --git a/ann/ann_evaluator.cpp b/ann/ann_evaluator.cpp
@@ -60,37 +60,31 @@ void ANNEvaluator::Deserialize(std::istream &is)
 	InvalidateCache();
 }
 
-void ANNEvaluator::Train(const std::vector<std::string> &positions, const NNMatrixRM &y, const std::vector<FeaturesConv::FeatureDescription> &featureDescriptions, float learningRate)
+float ANNEvaluator::Train(const NNMatrixRM &pred, EvalNet::Activations &act, const NNMatrixRM &targets)
 {
-	auto x = BoardsToFeatureRepresentation_(positions, featureDescriptions);
-
-	NNMatrixRM predictions;
-	EvalNet::Activations act;
-
-	m_mainAnn.InitializeActivations(act);
-
-	predictions = m_mainAnn.ForwardPropagate(x, act);
-
-	NNMatrixRM errorsDerivative = ComputeErrorDerivatives_(predictions, y, act.actIn[act.actIn.size() - 1], 1.0f, 1.0f);
+	NNMatrixRM errorsDerivative = ComputeErrorDerivatives_(pred, targets, act.actIn[act.actIn.size() - 1], 1.0f, 1.0f);
 
 	EvalNet::Gradients grad;
 
 	m_mainAnn.InitializeGradients(grad);
 
 	m_mainAnn.BackwardPropagateComputeGrad(errorsDerivative, act, grad);
 
-	m_mainAnn.ApplyWeightUpdates(grad, learningRate, 0.0f);
+	m_mainAnn.ApplyWeightUpdates(grad, 1.0f, 0.0f);
 
 	InvalidateCache();
+
+	return ((pred - targets).array() * (pred - targets).array()).sum() / targets.rows();
 }
 
-void ANNEvaluator::TrainLoop(const std::vector<std::string> &positions, const NNMatrixRM &y, int64_t epochs, const std::vector<FeaturesConv::FeatureDescription> &featureDescriptions)
+void ANNEvaluator::EvaluateForWhiteMatrix(const NNMatrixRM &x, NNMatrixRM &pred, EvalNet::Activations &act)
 {
-	auto x = BoardsToFeatureRepresentation_(positions, featureDescriptions);
-
-	LearnAnn::TrainANN(x, y, m_mainAnn, epochs);
+	if (act.act.size() == 0)
+	{
+		m_mainAnn.InitializeActivations(act);
+	}
 
-	InvalidateCache();
+	pred = m_mainAnn.ForwardPropagate(x, act);
 }
 
 void ANNEvaluator::TrainBounds(const std::vector<std::string> &positions, const std::vector<FeaturesConv::FeatureDescription> &featureDescriptions, float learningRate)
diff --git a/ann/ann_evaluator.h b/ann/ann_evaluator.h
@@ -68,9 +68,10 @@ class ANNEvaluator : public EvaluatorIface
 
 	void Deserialize(std::istream &is);
 
-	void Train(const std::vector<std::string> &positions, const NNMatrixRM &y, const std::vector<FeaturesConv::FeatureDescription> &featureDescriptions, float learningRate);
+	float Train(const NNMatrixRM &pred, EvalNet::Activations &act, const NNMatrixRM &targets);
 
-	void TrainLoop(const std::vector<std::string> &positions, const NNMatrixRM &y, int64_t epochs, const std::vector<FeaturesConv::FeatureDescription> &featureDescriptions);
+	// this is a special bulk evaluate for training
+	void EvaluateForWhiteMatrix(const NNMatrixRM &x, NNMatrixRM &pred, EvalNet::Activations &act);
 
 	void TrainBounds(const std::vector<std::string> &positions, const std::vector<FeaturesConv::FeatureDescription> &featureDescriptions, float learningRate);
 
diff --git a/ann/ann_impl.h b/ann/ann_impl.h
@@ -120,22 +120,14 @@ FCANN<ACTF, ACTFLast>::FCANN(
 			// we have a fully connected layer
 			m_params.weightMasks.push_back(NNMatrix::Ones(in_size, out_size));
 		}
-
-		m_params.outputBiasLastUpdate.push_back(NNVector::Zero(out_size));
-		m_params.weightsLastUpdate.push_back(NNMatrix::Zero(in_size, out_size));
-
-		m_params.outputBiasEg2.push_back(NNVector::Zero(out_size));
-		m_params.weightsEg2.push_back(NNMatrix::Zero(in_size, out_size));
-
-		m_params.outputBiasRMSd2.push_back(NNVector::Zero(out_size));
-		m_params.weightsRMSd2.push_back(NNMatrix::Zero(in_size, out_size));
 	}
 
 	m_params.evalTmp.resize(hiddenLayers.size() + 2);
 	m_params.evalSingleTmp.resize(hiddenLayers.size() + 2);
 
 	UpdateWeightMasksRegions_();
 	UpdateWeightSemiSparse_();
+	InitializeOptimizationState_();
 }
 
 template <ActivationFunc ACTF, ActivationFunc ACTFLast>
@@ -400,20 +392,21 @@ float FCANN<ACTF, ACTFLast>::TrainGDM(const MatrixBase<Derived1> &x, const Matri
 }
 
 template <ActivationFunc ACTF, ActivationFunc ACTFLast>
-void FCANN<ACTF, ACTFLast>::ApplyWeightUpdates(const Gradients &grad, float learningRate, float reg)
+void FCANN<ACTF, ACTFLast>::ApplyWeightUpdates(const Gradients &grad, float /*learningRate*/, float reg)
 {
 	assert(grad.weightGradients.size() == m_params.weights.size());
 	assert(grad.biasGradients.size() == m_params.outputBias.size());
 	assert(grad.weightGradients.size() == grad.biasGradients.size());
 
+	/* // for SGD + M
 	m_params.weightsLastUpdate.resize(m_params.weights.size());
 	m_params.outputBiasLastUpdate.resize(m_params.outputBias.size());
+	*/
 
-	m_params.weightsEg2.resize(m_params.weights.size());
-	m_params.outputBiasEg2.resize(m_params.outputBias.size());
-
-	m_params.weightsRMSd2.resize(m_params.weights.size());
-	m_params.outputBiasRMSd2.resize(m_params.outputBias.size());
+	if (m_params.weightsEg2.size() != m_params.weights.size())
+	{
+		InitializeOptimizationState_();
+	}
 
 	for (size_t layer = 0; layer < m_params.weights.size(); ++layer)
 	{
@@ -484,8 +477,8 @@ void FCANN<ACTF, ACTFLast>::ApplyWeightUpdates(const Gradients &grad, float lear
 				#endif
 
 				// update Eg2 (ADADELTA)
-				float decay = 0.99f;
-				float e = 1e-8f;
+				float decay = 0.95f;
+				float e = 1e-6f;
 				weightsEg2Block.array() *= decay;
 				weightsEg2Block.array() += (weightsGradientsBlock.array() * weightsGradientsBlock.array()) * (1.0f - decay);
 				biasEg2Block.array() *= decay;
@@ -498,9 +491,9 @@ void FCANN<ACTF, ACTFLast>::ApplyWeightUpdates(const Gradients &grad, float lear
 				//NNMatrix weightDelta = -weightsGradientsBlock.array() * learningRate /*+ weightReg.array()*/;
 				//NNVector biasDelta = -biasGradientsBlock.array() * learningRate;
 
-				weightsBlock += weightDelta * learningRate;
+				weightsBlock += weightDelta;
 				weightsBlock.array() *= weightMaskBlock.array();
-				biasBlock += biasDelta * learningRate;
+				biasBlock += biasDelta;
 
 				FP weightMax = std::max(std::max(weightsBlock.maxCoeff(), -weightsBlock.minCoeff()), std::max(biasBlock.maxCoeff(), -biasBlock.minCoeff()));
 				if (weightMax > MAX_WEIGHT)
@@ -779,6 +772,27 @@ void FCANN<ACTF, ACTFLast>::UpdateWeightSemiSparse_()
 	m_params.weightsSemiSparseCurrent = true;
 }
 
+
+template <ActivationFunc ACTF, ActivationFunc ACTFLast>
+void FCANN<ACTF, ACTFLast>::InitializeOptimizationState_()
+{
+	m_params.weightsEg2.resize(m_params.weights.size());
+	m_params.outputBiasEg2.resize(m_params.outputBias.size());
+
+	m_params.weightsRMSd2.resize(m_params.weights.size());
+	m_params.outputBiasRMSd2.resize(m_params.outputBias.size());
+
+	for (size_t i = 0; i < m_params.weights.size(); ++i)
+	{
+		m_params.outputBiasEg2[i] = NNVector::Zero(m_params.outputBias[i].cols());
+		m_params.weightsEg2[i] = NNMatrix::Zero(m_params.weights[i].rows(), m_params.weights[i].cols());
+
+		m_params.outputBiasRMSd2[i] = NNVector::Zero(m_params.outputBias[i].cols());
+		m_params.weightsRMSd2[i] = NNMatrix::Zero(m_params.weights[i].rows(), m_params.weights[i].cols());
+	}
+}
+
+
 /* serialization format:
  * numLayers
  * for each layer:
diff --git a/ann/features_conv.cpp b/ann/features_conv.cpp
@@ -291,6 +291,26 @@ void PushSquareFeatures(std::vector<T> &ret, const Board &/*board*/, AttackMaps
 	{
 		PushPosFloat(ret, sq, atkMaps.whiteCtrl[sq], group);
 		PushPosFloat(ret, sq, atkMaps.blackCtrl[sq], group + 1);
+
+		/*
+		PieceType pt = board.GetPieceAtSquare(sq);
+
+		if (pt == EMPTY)
+		{
+			PushPosFloat(ret, sq, 0.0f, group + 2);
+			PushPosFloat(ret, sq, 0.0f, group + 3);
+		}
+		else if (GetColor(pt) == WHITE)
+		{
+			PushPosFloat(ret, sq, NormalizeCount(SEE::SEE_MAT[board.GetPieceAtSquare(sq)], SEE::SEE_MAT[WK]), group + 2);
+			PushPosFloat(ret, sq, 0.0f, group + 3);
+		}
+		else if (GetColor(pt) == BLACK)
+		{
+			PushPosFloat(ret, sq, 0.0f, group + 2);
+			PushPosFloat(ret, sq, NormalizeCount(SEE::SEE_MAT[board.GetPieceAtSquare(sq)], SEE::SEE_MAT[WK]), group + 3);
+		}
+		*/
 	}
 
 	group += 2;
diff --git a/ann/features_conv.h b/ann/features_conv.h
@@ -79,6 +79,16 @@ struct FeatureDescription
 template <typename T>
 void ConvertBoardToNN(Board &board, std::vector<T> &ret);
 
+inline int64_t GetNumFeatures()
+{
+	Board b;
+
+	std::vector<FeaturesConv::FeatureDescription> ret;
+	FeaturesConv::ConvertBoardToNN(b, ret);
+
+	return static_cast<int64_t>(ret.size());
+}
+
 // additional info for conversion
 struct ConvertMovesInfo
 {
diff --git a/learn.cpp b/learn.cpp
diff --git a/learn.h b/learn.h