docs/cpp/gradient__descent-inl_8hpp_source.html

 /* Copyright © 2017 Apple Inc. All rights reserved.
  *
  * Use of this source code is governed by a BSD-3-clause license that can
  * be found in the LICENSE.txt file or at https://opensource.org/licenses/BSD-3-Clause
  */
 #ifndef TURI_GRADIENT_DESCENT_H_
 #define TURI_GRADIENT_DESCENT_H_

 #include <core/data/flexible_type/flexible_type.hpp>
 #include <Eigen/Core>

 #include <ml/optimization/utils.hpp>
 #include <ml/optimization/optimization_interface.hpp>
 #include <ml/optimization/regularizer_interface.hpp>
 #include <ml/optimization/line_search-inl.hpp>
 #include <core/logging/table_printer/table_printer.hpp>


 // TODO: List of todo's for this file
 //------------------------------------------------------------------------------
 // 1. Constant line seach tuning?

 namespace turi {

 namespace optimization {


 /**
  * \ingroup group_optimization
  * \addtogroup gradient_descent Gradient Descent
  * \{
  */

 /**
  *
  * Solve a first_order_optimization_iterface model with a gradient descent
  * method.
  *
  * \param[in,out] model  Model with first order optimization interface.
  * \param[in] init_point Starting point for the solver.
  * \param[in,out] opts   Solver options.
  * \returns stats        Solver return stats.
  * \param[in] reg        Shared ptr to an interface to a regularizer.
  * \tparam Vector        Sparse or dense gradient representation.
  *
  *
 */
 template <typename Vector = DenseVector>
 inline solver_return gradient_descent(first_order_opt_interface& model,
     const DenseVector& init_point,
     std::map<std::string, flexible_type>& opts,
     const std::shared_ptr<regularizer_interface> reg=NULL){

     // Benchmarking utils.
     timer t;
     double start_time = t.current_time();

     logprogress_stream << "Starting Gradient Descent " << std::endl;
     logprogress_stream << "--------------------------------------------------------" << std::endl;
     std::stringstream ss;
     ss.str("");

     // Step 1: Algorithm option init
     // ------------------------------------------------------------------------
     // Check that all solver options are present.
     // Load options
     size_t iter_limit = opts["max_iterations"];
     double convergence_threshold = opts["convergence_threshold"];
     double step_size = opts["step_size"];
     size_t iters = 1;
     solver_return stats;

     // Print progress
     table_printer printer(
         model.get_status_header({"Iteration", "Passes", "Step size", "Elapsed Time"}));
     printer.print_header();


     // First compute the residual. Sometimes, you already have the solution
     // during the starting point. In these settings, you don't want to waste
     // time performing a step of the algorithm.
     DenseVector point = init_point;
     Vector gradient(point.size());
     double func_value;
     model.compute_first_order_statistics(point, gradient, func_value);
     double residual = compute_residual(gradient);

     stats.func_evals++;
     stats.gradient_evals++;

     // Needs to store previous point and gradient information
     DenseVector delta_point = point;
     delta_point.setZero();

     // First iteration will take longer. Warn the user.
     logprogress_stream <<"Tuning step size. First iteration could take longer"
                        <<" than subsequent iterations." << std::endl;


     // Nan Checking!
     if (!std::isfinite(residual)) {
       stats.status = OPTIMIZATION_STATUS::OPT_NUMERIC_OVERFLOW;
     }

     // Step 2: Algorithm starts here
     // ------------------------------------------------------------------------
     // While not converged
     while((residual >= convergence_threshold) && (iters <= iter_limit)){


       // Line search for step size.
       ls_return ls_stats;

       // Pick line search based on regularizers.
       if (reg != NULL){
         step_size  *= 2;
         ls_stats =  backtracking(model,
                                  step_size,
                                  func_value,
                                  point,
                                  gradient,
                                  -gradient,
                                  reg);
       } else {
           ls_stats =  more_thuente(model,
                                    step_size,
                                    func_value,
                                    point,
                                    gradient,
                                    -gradient);
       }


       // Add info from line search
       stats.func_evals += ls_stats.func_evals;
       stats.gradient_evals += ls_stats.gradient_evals;
       step_size = ls_stats.step_size;

       // Line search failed
       if (ls_stats.status == false){
         stats.status = OPTIMIZATION_STATUS::OPT_LS_FAILURE;
         break;
       }

       // \delta x_k = x_{k} - x_{k-1}
       delta_point =  point;
       point = point -step_size * gradient;
       if (reg != NULL)
         reg->apply_proximal_operator(point, step_size);
       delta_point = point - delta_point;

       // Numerical error: Insufficient progress.
       if (delta_point.norm() <= OPTIMIZATION_ZERO){
         stats.status = OPTIMIZATION_STATUS::OPT_NUMERIC_ERROR;
         break;
       }
       // Numerical error: Numerical overflow. (Step size was too large)
       if (!delta_point.array().array().isFinite().all()) {
         stats.status = OPTIMIZATION_STATUS::OPT_NUMERIC_OVERFLOW;
         break;
       }

       // Compute residual norm (to check for convergence)
       model.compute_first_order_statistics(point, gradient, func_value);
       stats.num_passes++;
       residual = compute_residual(gradient);
       iters++;

       // Print progress
       auto stat_info = {std::to_string(iters),
                         std::to_string(stats.num_passes),
                         std::to_string(step_size),
                         std::to_string(t.current_time())};

       auto row = model.get_status(point, stat_info);
       printer.print_progress_row_strs(iters, row);
     }

     printer.print_footer();

     // Step 3: Return optimization model status.
     // ------------------------------------------------------------------------
     if (stats.status == OPTIMIZATION_STATUS::OPT_UNSET) {
       if (iters < iter_limit){
         stats.status = OPTIMIZATION_STATUS::OPT_OPTIMAL;
       } else {
         stats.status = OPTIMIZATION_STATUS::OPT_ITERATION_LIMIT;
       }
     }
     stats.iters = static_cast<int>(iters);
     stats.residual = residual;
     stats.gradient = gradient;
     stats.func_value = func_value;
     stats.solve_time = t.current_time() - start_time;
     stats.solution = point;
     stats.progress_table = printer.get_tracked_table();

     // Display solver stats
     log_solver_summary_stats(stats);
     return stats;
 }


 } // optimizaiton

 /// \}
 } // turicreate

 #endif
turi::optimization::_solver_return::status
OPTIMIZATION_STATUS status
Definition: optimization_interface.hpp:111

turi::optimization::OPTIMIZATION_STATUS::OPT_ITERATION_LIMIT
Iteration limit reached.

turi::optimization::_ls_return::step_size
double step_size
Definition: optimization_interface.hpp:122

turi::optimization::_solver_return::solution
DenseVector solution
Definition: optimization_interface.hpp:103

turi::optimization::backtracking
ls_return backtracking(first_order_opt_interface &model, double init_step, double init_func_value, DenseVector point, Vector gradient, DenseVector direction, const std::shared_ptr< regularizer_interface > reg=NULL)
Definition: line_search-inl.hpp:681

turi::optimization::OPTIMIZATION_ZERO
const double OPTIMIZATION_ZERO
Optimization method zero.
Definition: optimization_interface.hpp:79

turi::optimization::more_thuente
ls_return more_thuente(first_order_opt_interface &model, double init_step, double init_func_value, DenseVector point, Vector gradient, DenseVector direction, double function_scaling=1.0, const std::shared_ptr< smooth_regularizer_interface > reg=NULL, size_t max_function_evaluations=LS_MAX_ITER)
Definition: line_search-inl.hpp:329

turi::optimization::_ls_return::status
bool status
Definition: optimization_interface.hpp:123

turi::optimization::OPTIMIZATION_STATUS::OPT_OPTIMAL
Optimal solution found.

turi::optimization::gradient_descent
solver_return gradient_descent(first_order_opt_interface &model, const DenseVector &init_point, std::map< std::string, flexible_type > &opts, const std::shared_ptr< regularizer_interface > reg=NULL)
Definition: gradient_descent-inl.hpp:49

turi::optimization::_solver_return::gradient_evals
int gradient_evals
Definition: optimization_interface.hpp:109

turi::optimization::first_order_opt_interface::get_status
virtual std::vector< std::string > get_status(const DenseVector &coefs, const std::vector< std::string > &stats)

turi::optimization::first_order_opt_interface::get_status_header
virtual std::vector< std::pair< std::string, size_t > > get_status_header(const std::vector< std::string > &stats)

turi::optimization::_solver_return::residual
double residual
Definition: optimization_interface.hpp:106

turi::optimization::_ls_return::gradient_evals
int gradient_evals
Definition: optimization_interface.hpp:125

turi::optimization::_solver_return::gradient
DenseVector gradient
Definition: optimization_interface.hpp:104

turi::timer::current_time
double current_time() const
Returns the elapsed time in seconds since turi::timer::start was last called.
Definition: timer.hpp:83

logprogress_stream
#define logprogress_stream
Definition: logger.hpp:325

turi
SKD.
Definition: capi_initialization.hpp:11

turi::optimization::OPTIMIZATION_STATUS::OPT_UNSET
Optimizer wasn&#39;t called.

turi::optimization::_solver_return::iters
int iters
Definition: optimization_interface.hpp:101

turi::optimization::OPTIMIZATION_STATUS::OPT_LS_FAILURE
Line search iteration limit hit.

turi::optimization::first_order_opt_interface
Definition: optimization_interface.hpp:141

turi::optimization::_ls_return
Definition: optimization_interface.hpp:120

turi::optimization::OPTIMIZATION_STATUS::OPT_NUMERIC_OVERFLOW
Numerical overflow. Step size parameter may be too large.

turi::optimization::_solver_return::solve_time
double solve_time
Definition: optimization_interface.hpp:102

turi::optimization::compute_residual
double compute_residual(const DenseVector &gradient)

turi::optimization::_ls_return::func_evals
int func_evals
Definition: optimization_interface.hpp:124

turi::table_printer::print_header
void print_header() const

turi::table_printer
Definition: table_printer.hpp:200

turi::optimization::_solver_return
Definition: optimization_interface.hpp:99

turi::optimization::_solver_return::num_passes
int num_passes
Definition: optimization_interface.hpp:110

turi::timer
A simple class that can be used for benchmarking/timing up to microsecond resolution.
Definition: timer.hpp:59

turi::optimization::log_solver_summary_stats
void log_solver_summary_stats(const solver_return &stats, bool simple_mode=false)

turi::optimization::_solver_return::func_value
double func_value
Definition: optimization_interface.hpp:107

turi::optimization::_solver_return::func_evals
int func_evals
Definition: optimization_interface.hpp:108

turi::optimization::first_order_opt_interface::compute_first_order_statistics
virtual void compute_first_order_statistics(const DenseVector &point, DenseVector &gradient, double &function_value, const size_t mbStart=0, const size_t mbSize=-1)=0

turi::optimization::OPTIMIZATION_STATUS::OPT_NUMERIC_ERROR
Numerical underflow (not enough progress).