docs/cpp/newton__method-inl_8hpp_source.html

 /* Copyright © 2017 Apple Inc. All rights reserved.
  *
  * Use of this source code is governed by a BSD-3-clause license that can
  * be found in the LICENSE.txt file or at https://opensource.org/licenses/BSD-3-Clause
  */
 #ifndef TURI_NEWTON_METHOD_H_
 #define TURI_NEWTON_METHOD_H_

 #include <ml/optimization/optimization_interface.hpp>
 #include <core/data/flexible_type/flexible_type.hpp>
 #include <Eigen/Core>
 #include <Eigen/Cholesky>

 #include <ml/optimization/utils.hpp>
 #include <ml/optimization/optimization_interface.hpp>
 #include <ml/optimization/regularizer_interface.hpp>
 #include <ml/optimization/line_search-inl.hpp>
 #include <core/logging/table_printer/table_printer.hpp>

 // TODO: List of todo's for this file
 //------------------------------------------------------------------------------
 // 1. Sparse hessian newton method?

 namespace turi {

 namespace optimization {


 /**
  * \ingroup group_optimization
  * \addtogroup Newton Newton Method
  * \{
  */

 /**
  *
  * Solve a second_order_optimization_interface model with a (dense) hessian Newton
  * method.
  *
  * \param[in,out] model  Model with second order optimization interface.
  * \param[in] init_point Starting point for the solver.
  * \param[in,out] opts   Solver options.
  * \param[in]      reg   Shared ptr to an interface to a smooth regularizer.
  * \param[out] stats     Solver return stats.
  * \tparam Vector        Sparse or dense gradient representation.
  *
  * \note The hessian is always computed as a dense matrix. Only gradients are
  * allowed to be sparse. The implementation of Newton method must change when
  * the hessian is sparse. I.e we can no longer perform an LDLT decomposition to
  * invert the hessian matrix. We have to switch methods to Conjugate gradient
  * or Sparse LDLT decomposition.
  *
 */
 template <typename Vector = DenseVector>
 inline solver_return newton_method(second_order_opt_interface& model,
     const DenseVector& init_point,
     std::map<std::string, flexible_type>& opts,
     const std::shared_ptr<smooth_regularizer_interface> reg=NULL){

     // Benchmarking utils.
     timer t;
     double start_time = t.current_time();
     solver_return stats;

     logprogress_stream << "Starting Newton Method " << std::endl;
     logprogress_stream << "--------------------------------------------------------" << std::endl;
     std::stringstream ss;
     ss.str("");

     // Step 1: Algorithm option init
     // ------------------------------------------------------------------------
     // Load options
     size_t iter_limit = opts["max_iterations"];
     double convergence_threshold = opts["convergence_threshold"];
     double step_size = 1;
     size_t iters = 0;

     // Log iteration and residual norms
     table_printer printer(model.get_status_header(
                         {"Iteration", "Passes", "Elapsed Time"}));
     printer.print_header();

     // First compute the gradient. Sometimes, you already have the solution
     // during the starting point. In these settings, you don't want to waste
     // time performing a newton the step.
     DenseVector point = init_point;
     Vector gradient(point.size());
     DenseVector reg_gradient(point.size());
     DenseMatrix hessian(gradient.size(), gradient.size());
     DiagonalMatrix reg_hessian(gradient.size());
     double func_value;
     double relative_error;

     // Compute gradient (Add regularizer gradient)
     model.compute_second_order_statistics(point, hessian, gradient, func_value);
     stats.num_passes++;
     if (reg != NULL){
       reg->compute_gradient(point, reg_gradient);
       gradient += reg_gradient;
     }
     double residual = compute_residual(gradient);

     // Keep track of previous point
     DenseVector delta_point = point;
     delta_point.setZero();


     // Nan Checking!
     if (std::isnan(residual) || std::isinf(residual)){
       stats.status = OPTIMIZATION_STATUS::OPT_NUMERIC_OVERFLOW;
     }

     // Step 2: Algorithm starts here
     // ------------------------------------------------------------------------
     // While not converged
     while((residual >= convergence_threshold) && (iters < iter_limit)){

       // Add regularizer hessian
       if (reg != NULL){
         reg->compute_hessian(point, reg_hessian);
         hessian += reg_hessian;
       }
       delta_point = -step_size * hessian.ldlt().solve(gradient);
       relative_error = (hessian*delta_point + gradient).norm()
         / std::max(gradient.norm(), OPTIMIZATION_ZERO);

       // LDLT Decomposition failed.
       if (relative_error > convergence_threshold){
         logprogress_stream << "WARNING: Matrix is close to being singular or"
           << " badly scaled. The solution is accurate only up to a tolerance of "
           << relative_error << ". This typically happens when regularization"
           << " is not sufficient. Consider increasing regularization."
           << std::endl;
         stats.status = OPTIMIZATION_STATUS::OPT_NUMERIC_ERROR;
         break;
       }

       // Update the new point and gradient
       point = point + delta_point;

       // Numerical overflow. (Step size was too large)
       if (!delta_point.array().isFinite().all()) {
         stats.status = OPTIMIZATION_STATUS::OPT_NUMERIC_OVERFLOW;
         break;
       }

       model.compute_second_order_statistics(point, hessian, gradient, func_value);
       if (reg != NULL){
         reg->compute_gradient(point, reg_gradient);
         gradient += reg_gradient;
       }
       residual = compute_residual(gradient);
       stats.num_passes++;
       iters++;

       // Log info for debugging.
       logstream(LOG_INFO) << "Iters  (" << iters << ") "
                           << "Passes (" << stats.num_passes << ") "
                           << "Residual (" << residual << ") "
                           << "Loss (" << func_value << ") "
                           << std::endl;

       // Check for nan's in the function value.
       if(std::isinf(func_value) || std::isnan(func_value)) {
         stats.status = OPTIMIZATION_STATUS::OPT_NUMERIC_ERROR;
         break;
       }

       // Print progress
       auto stat_info = {std::to_string(iters),
                         std::to_string(stats.num_passes),
                         std::to_string(t.current_time())};
       auto row = model.get_status(point, stat_info);
       printer.print_progress_row_strs(iters, row);

     }
     printer.print_footer();

     // Step 3: Return optimization model status.
     // ------------------------------------------------------------------------
     if (stats.status == OPTIMIZATION_STATUS::OPT_UNSET) {
       if (iters < iter_limit){
         stats.status = OPTIMIZATION_STATUS::OPT_OPTIMAL;
       } else {
         stats.status = OPTIMIZATION_STATUS::OPT_ITERATION_LIMIT;
       }
     }
     stats.iters = static_cast<int>(iters);
     stats.residual = residual;
     stats.func_value = func_value;
     stats.solve_time = t.current_time() - start_time;
     stats.solution = point;
     stats.gradient = gradient;
     stats.hessian = hessian;
     stats.progress_table = printer.get_tracked_table();

     // Display solver stats
     log_solver_summary_stats(stats);

     return stats;

 }


 } // optimizaiton

 /// \}
 } // turicreate

 #endif
logstream
#define logstream(lvl)
Definition: logger.hpp:276

turi::optimization::_solver_return::status
OPTIMIZATION_STATUS status
Definition: optimization_interface.hpp:111

turi::optimization::OPTIMIZATION_STATUS::OPT_ITERATION_LIMIT
Iteration limit reached.

turi::optimization::_solver_return::solution
DenseVector solution
Definition: optimization_interface.hpp:103

turi::optimization::OPTIMIZATION_ZERO
const double OPTIMIZATION_ZERO
Optimization method zero.
Definition: optimization_interface.hpp:79

turi::optimization::second_order_opt_interface::compute_second_order_statistics
virtual void compute_second_order_statistics(const DenseVector &point, DenseMatrix &Hessian, DenseVector &gradient, double &function_value)=0

turi::optimization::_solver_return::hessian
DenseMatrix hessian
Definition: optimization_interface.hpp:105

turi::optimization::newton_method
solver_return newton_method(second_order_opt_interface &model, const DenseVector &init_point, std::map< std::string, flexible_type > &opts, const std::shared_ptr< smooth_regularizer_interface > reg=NULL)
Definition: newton_method-inl.hpp:55

turi::optimization::second_order_opt_interface
Definition: optimization_interface.hpp:253

turi::optimization::OPTIMIZATION_STATUS::OPT_OPTIMAL
Optimal solution found.

LOG_INFO
#define LOG_INFO
Definition: logger.hpp:101

turi::optimization::first_order_opt_interface::get_status
virtual std::vector< std::string > get_status(const DenseVector &coefs, const std::vector< std::string > &stats)

turi::optimization::first_order_opt_interface::get_status_header
virtual std::vector< std::pair< std::string, size_t > > get_status_header(const std::vector< std::string > &stats)

turi::optimization::_solver_return::residual
double residual
Definition: optimization_interface.hpp:106

turi::optimization::_solver_return::gradient
DenseVector gradient
Definition: optimization_interface.hpp:104

turi::timer::current_time
double current_time() const
Returns the elapsed time in seconds since turi::timer::start was last called.
Definition: timer.hpp:83

logprogress_stream
#define logprogress_stream
Definition: logger.hpp:325

turi
SKD.
Definition: capi_initialization.hpp:11

turi::optimization::OPTIMIZATION_STATUS::OPT_UNSET
Optimizer wasn&#39;t called.

turi::optimization::_solver_return::iters
int iters
Definition: optimization_interface.hpp:101

turi::optimization::OPTIMIZATION_STATUS::OPT_NUMERIC_OVERFLOW
Numerical overflow. Step size parameter may be too large.

turi::optimization::_solver_return::solve_time
double solve_time
Definition: optimization_interface.hpp:102

turi::optimization::compute_residual
double compute_residual(const DenseVector &gradient)

turi::table_printer::print_header
void print_header() const

turi::table_printer
Definition: table_printer.hpp:200

turi::optimization::_solver_return
Definition: optimization_interface.hpp:99

turi::optimization::_solver_return::num_passes
int num_passes
Definition: optimization_interface.hpp:110

turi::timer
A simple class that can be used for benchmarking/timing up to microsecond resolution.
Definition: timer.hpp:59

turi::optimization::log_solver_summary_stats
void log_solver_summary_stats(const solver_return &stats, bool simple_mode=false)

turi::optimization::_solver_return::func_value
double func_value
Definition: optimization_interface.hpp:107

turi::optimization::OPTIMIZATION_STATUS::OPT_NUMERIC_ERROR
Numerical underflow (not enough progress).