docs/cpp/lbfgs_8hpp_source.html

 /* Copyright © 2017 Apple Inc. All rights reserved.
  *
  * Use of this source code is governed by a BSD-3-clause license that can
  * be found in the LICENSE.txt file or at https://opensource.org/licenses/BSD-3-Clause
  */
 #ifndef TURI_LBFGS_2_H_
 #define TURI_LBFGS_2_H_

 #include <ml/optimization/optimization_interface.hpp>
 #include <core/data/flexible_type/flexible_type.hpp>
 #include <core/storage/sframe_data/sframe.hpp>

 #include <ml/optimization/utils.hpp>
 #include <ml/optimization/optimization_interface.hpp>
 #include <ml/optimization/regularizer_interface.hpp>
 #include <ml/optimization/line_search-inl.hpp>
 #include <Eigen/Core>

 typedef Eigen::VectorXd DenseVector;
 typedef Eigen::MatrixXd DenseMatrix;

 namespace turi {

 namespace optimization {

 /**
  * Solver status.
  */
 struct solver_status {
   size_t iteration = 0;                         /*!< Iterations taken */
   double solver_time = 0;                       /*!< Wall clock time (s) */
   DenseVector solution;                         /*!< Current Solution */
   DenseVector gradient;                         /*!< Current gradient */
   DenseMatrix hessian;                          /*!< Current hessian */
   double residual = NAN;                        /*!< Residual norm */
   double function_value = NAN;                  /*!< Function value */
   size_t num_function_evaluations = 0;          /*!< Function evals */
   size_t num_gradient_evaluations = 0;          /*!< Gradient evals */
   double step_size = 0;                         /*!< Current step size */

   OPTIMIZATION_STATUS status = OPTIMIZATION_STATUS::OPT_UNSET;  /*!< Status */
 };


 /**
  * \ingroup group_optimization
  * \addtogroup LBFGS LBFGS
  * \{
  */

 /**
  *
  * Solve a first_order_optimization_iterface model with an LBFGS
  * implementation.
  *
  * The implementation is based on Algorithm 7.4 (pg 178) of [1].
  *
  *  This subroutine solves an unconstrained minimization problem
  *  using the limited memory BFGS method. The routine is especially
  *  effective on problems involving a large number of variables. In
  *  a typical iteration of this method an approximation Hk to the
  *  inverse of the Hessian is obtained by applying M BFGS updates to
  *  a diagonal matrix Hk0, using information from the previous M steps.
  *  The user specifies the number M, which determines the amount of
  *  storage required by the routine. The user may also provide the
  *  diagonal matrices Hk0 if not satisfied with the default choice.
  *  The algorithm is described in [2].
  *
  *  The user is required to calculate the function value and its
  *  gradient.
  *
  *  The steplength is determined at each iteration by means of the
  *  line search routine MCVSRCH, which is a slight modification of
  *  the routine CSRCH written by More' and Thuente.
  *
  *
  * References:
  *
  * (1) Wright S.J  and J. Nocedal. Numerical optimization. Vol. 2.
  *                         New York: Springer, 1999.
  *
  * (2) "On the limited memory BFGS method for large scale optimization", by D.
  * Liu and J. Nocedal, Mathematical Programming B 45 (1989) 503-528.
  *
  * \param[in]     model  Model with first order optimization interface.
  * \param[in] init_point Starting point for the solver.
  * \param[in]     opts   Solver options.
  * \param[in]      reg   Shared ptr to an interface to a smooth regularizer.
  * \returns stats        Solver return stats.
  * \tparam Vector        Sparse or dense gradient representation.
  *
  */
 class lbfgs_solver {
  public:

   /** Construct the solver around a specific model interface.
    *
    * \param[in]     model  Model with first order optimization interface.
    */
   lbfgs_solver(std::shared_ptr<first_order_opt_interface> _model)
       : model(_model) {}

   /** Sets up (or resets) the solver.
    *
    * \param[in] init_point Starting point for the solver.
    * \param[in]     opts   Solver options.  Options are "lbfgs_memory_level" and
    *                       "convergence_threshold".  If not given, defaults are
    *                       taken from the table in optimization_interface.hpp.
    *
    * \param[in]      reg   Shared ptr to an interface to a smooth regularizer.
    */
   void setup(const DenseVector& init_point,
              const std::map<std::string, flexible_type>& opts,
              const std::shared_ptr<smooth_regularizer_interface>& reg = nullptr);

   /** Perform the next update of the solution.
    *
    *  Call this method repeatedly to perform the optimization.
    *  Each iteration updates the solution point with one step.
    */
   bool next_iteration();

   /** The status after a given iteration.
    *
    *
    *  The best solution so far is given by status().solution.
    *
    */
   const solver_status& status() const { return m_status; }

  private:

   timer compute_timer;

   // The model used in the optimization.
   std::shared_ptr<first_order_opt_interface> model;

   std::shared_ptr<smooth_regularizer_interface> reg;

   size_t num_variables = 0;
   size_t lbfgs_memory_level = 0;
   double function_value = NAN, function_scaling_factor = 1.0;

   solver_status m_status;

   // LBFGS storage
   // The search steps and gradient differences are stored in a order
   // controlled by the start point.

   // Step difference (prev m iters)
   Eigen::Matrix<double, Eigen::Dynamic, Eigen::Dynamic, Eigen::ColMajor> y;

   // Gradient difference (prev m iters)
   Eigen::Matrix<double, Eigen::Dynamic, Eigen::Dynamic, Eigen::ColMajor> s;

   DenseVector q;         // Storage required for the 2-loop recursion
   DenseVector rho;       // Scaling factors (prev m iters)
   DenseVector alpha;     // Step sizes (prev m iters)

   // Buffers used internally.  The function value and gradient here is scaled my
   // m_status.function_scaling_value for numerical stability.
   DenseVector delta_point, gradient, delta_grad, previous_gradient;

   double convergence_threshold = 0;
 };

 // Old version for backwards compatibility with the previous interface.
 // Includes printing.
 solver_return lbfgs_compat(
     std::shared_ptr<first_order_opt_interface> model,
     const DenseVector& init_point,
     const std::map<std::string, flexible_type>& opts,
     const std::shared_ptr<smooth_regularizer_interface>& reg = nullptr);

 /** Solves lbgfgs problem end-to-end.
  *
  *  This class wraps the above iterative solver in a convenience function,
  * iterating the solution until completion.
  *
  *  \param model The implementation of first_order_opt_interface used in the
  * optimization.
  *
  *  \param init_point The initial point at which the optimization starts.
  *
  *  \param opts The options.  Uses all the options given to setup() in the
  * lbfgs_solver class, plus "max_iterations" to terminate the optimization after
  * a given number of iterations.
  *
  * \param reg Optional regularization interface.
  *
  */
 solver_status lbfgs(
     std::shared_ptr<first_order_opt_interface> model,
     const DenseVector& init_point,
     const std::map<std::string, flexible_type>& opts,
     const std::shared_ptr<smooth_regularizer_interface>& reg = nullptr);


 }  // namespace optimization

 /// \}
 }  // namespace turi

 #endif
turi::optimization::solver_status::solver_time
double solver_time
Definition: lbfgs.hpp:31

turi::optimization::solver_status::num_function_evaluations
size_t num_function_evaluations
Definition: lbfgs.hpp:37

turi::optimization::solver_status::solution
DenseVector solution
Definition: lbfgs.hpp:32

turi::optimization::solver_status
Definition: lbfgs.hpp:29

turi::optimization::solver_status::residual
double residual
Definition: lbfgs.hpp:35

turi::optimization::OPTIMIZATION_STATUS
OPTIMIZATION_STATUS
Optimization status.
Definition: optimization_interface.hpp:62

turi::optimization::solver_status::status
OPTIMIZATION_STATUS status
Definition: lbfgs.hpp:41

turi::optimization::solver_status::step_size
double step_size
Definition: lbfgs.hpp:39

turi::optimization::solver_status::function_value
double function_value
Definition: lbfgs.hpp:36

turi
SKD.
Definition: capi_initialization.hpp:11

turi::optimization::OPTIMIZATION_STATUS::OPT_UNSET
Optimizer wasn&#39;t called.

turi::optimization::lbfgs_solver
Definition: lbfgs.hpp:93

turi::optimization::lbfgs
solver_status lbfgs(std::shared_ptr< first_order_opt_interface > model, const DenseVector &init_point, const std::map< std::string, flexible_type > &opts, const std::shared_ptr< smooth_regularizer_interface > &reg=nullptr)

turi::optimization::solver_status::hessian
DenseMatrix hessian
Definition: lbfgs.hpp:34

turi::optimization::solver_status::iteration
size_t iteration
Definition: lbfgs.hpp:30

turi::optimization::lbfgs_solver::lbfgs_solver
lbfgs_solver(std::shared_ptr< first_order_opt_interface > _model)
Definition: lbfgs.hpp:100

turi::optimization::_solver_return
Definition: optimization_interface.hpp:99

turi::optimization::lbfgs_solver::status
const solver_status & status() const
Definition: lbfgs.hpp:129

turi::optimization::solver_status::num_gradient_evaluations
size_t num_gradient_evaluations
Definition: lbfgs.hpp:38

turi::optimization::solver_status::gradient
DenseVector gradient
Definition: lbfgs.hpp:33

turi::timer
A simple class that can be used for benchmarking/timing up to microsecond resolution.
Definition: timer.hpp:59