docs/cpp/od__darknet__yolo__model__trainer_8hpp_source.html

 /* Copyright © 2020 Apple Inc. All rights reserved.
  *
  * Use of this source code is governed by a BSD-3-clause license that can
  * be found in the LICENSE.txt file or at
  * https://opensource.org/licenses/BSD-3-Clause
  */

 #ifndef TOOLKITS_OBJECT_DETECTION_OD_DARKNET_YOLO_MODEL_TRAINER_HPP_
 #define TOOLKITS_OBJECT_DETECTION_OD_DARKNET_YOLO_MODEL_TRAINER_HPP_

 /**
  * \file od_darknet_yolo_model_trainer.hpp
  *
  * Defines helper functions and the Model subclass for the darknet-yolo
  * architecture.
  */

 #include <ml/neural_net/compute_context.hpp>
 #include <ml/neural_net/model_backend.hpp>
 #include <ml/neural_net/model_spec.hpp>
 #include <toolkits/object_detection/od_model_trainer.hpp>

 namespace turi {
 namespace object_detection {

 /**
  * Configures an image_augmenter for inference given darknet-yolo network
  * parameters.
  */
 neural_net::image_augmenter::options DarknetYOLOInferenceAugmentationOptions(
     int batch_size, int output_height, int output_width);

 /**
  * Configures an image_augmenter for training given darknet-yolo network
  * parameters.
  */
 neural_net::image_augmenter::options DarknetYOLOTrainingAugmentationOptions(
     int batch_size, int output_height, int output_width);

 /**
  * Encodes the annotations of an input batch into the format expected by the
  * darknet-yolo network.
  */
 EncodedInputBatch EncodeDarknetYOLO(InputBatch input_batch,
                                     size_t output_height, size_t output_width,
                                     size_t num_anchors, size_t num_classes);

 /**
  * Decodes the raw inference output into structured predictions.
  */
 InferenceOutputBatch DecodeDarknetYOLOInference(EncodedBatch batch,
                                                 float confidence_threshold,
                                                 float iou_threshold);

 /**
  * Wrapper that integrates a darknet-yolo model_backend into a training
  * pipeline.
  *
  * \todo Once model_backend exposes support for explicit asynchronous
  * invocations, this class won't be able to simply use the Transform base class.
  */
 class DarknetYOLOBackendTrainingWrapper
     : public neural_net::Transform<EncodedInputBatch, TrainingOutputBatch> {
  public:
   // Uses base_learning_rate and max_iterations to determine the learning-rate
   // schedule.
   DarknetYOLOBackendTrainingWrapper(
       std::shared_ptr<neural_net::model_backend> impl, float base_learning_rate,
       int max_iterations)
       : impl_(std::move(impl)),
         base_learning_rate_(base_learning_rate),
         max_iterations_(max_iterations) {}

   TrainingOutputBatch Invoke(EncodedInputBatch input_batch) override;

  private:
   void ApplyLearningRateSchedule(int iteration_id);

   std::shared_ptr<neural_net::model_backend> impl_;
   float base_learning_rate_ = 0.f;
   int max_iterations_ = 0;
 };

 /**
  * Wrapper that integrates a darknet-yolo model_backend into an inference
  * pipeline.
  *
  * \todo Once model_backend exposes support for explicit asynchronous
  * invocations, this class won't be able to simply use the Transform base class.
  */
 class DarknetYOLOBackendInferenceWrapper
     : public neural_net::Transform<EncodedInputBatch, EncodedBatch> {
  public:
   DarknetYOLOBackendInferenceWrapper(
       std::shared_ptr<neural_net::model_backend> impl)
       : impl_(std::move(impl)) {}

   EncodedBatch Invoke(EncodedInputBatch input_batch) override;

  private:
   std::shared_ptr<neural_net::model_backend> impl_;
 };

 /**
  * Wrapper for a darknet-yolo model_backend that publishes checkpoints.
  */
 class DarknetYOLOCheckpointer
     : public neural_net::Iterator<std::unique_ptr<Checkpoint>> {
  public:
   DarknetYOLOCheckpointer(const Config& config,
                           std::shared_ptr<neural_net::model_backend> impl)
       : config_(config), impl_(std::move(impl)) {}

   bool HasNext() const override { return impl_ != nullptr; }

   std::unique_ptr<Checkpoint> Next() override;

  private:
   Config config_;
   std::shared_ptr<neural_net::model_backend> impl_;
 };

 /**
  * Subclass of Checkpoint that generates DarknetYOLOModelTrainer
  * instances.
  */
 class DarknetYOLOCheckpoint : public Checkpoint {
  public:
   /**
    * Initializes a new model, combining the pre-trained warm-start weights with
    * random initialization for the final layers.
    */
   DarknetYOLOCheckpoint(Config config, const std::string& pretrained_model_path, int random_seed);

   /** Loads weights saved from a DarknetYOLOModelTrainer. */
   DarknetYOLOCheckpoint(Config config, neural_net::float_array_map weights);

   const Config& config() const override;
   const neural_net::float_array_map& weights() const override;

   std::unique_ptr<ModelTrainer> CreateModelTrainer(
       neural_net::compute_context* context) const override;

   neural_net::pipeline_spec ExportToCoreML(const std::string& input_name,
                                            const std::string& coordinates_name,
                                            const std::string& confidence_name, bool use_nms_layer,
                                            float iou_threshold,
                                            float confidence_threshold) const override;

   CheckpointMetadata GetCheckpointMetadata() const override;

   /** Returns the config dictionary used to initialize darknet-yolo backends. */
   neural_net::float_array_map internal_config() const;

   /** Returns the weights with the keys expected by the backends. */
   neural_net::float_array_map internal_weights() const;

  private:
   Config config_;

   std::unique_ptr<neural_net::model_spec> model_spec_;
   neural_net::float_array_map weights_;
 };

 /** Subclass of ModelTrainer encapsulating the darknet-yolo architecture. */
 class DarknetYOLOModelTrainer : public ModelTrainer {
  public:
   /**
    * Initializes a model from a checkpoint.
    */
   DarknetYOLOModelTrainer(const DarknetYOLOCheckpoint& checkpoint,
                           neural_net::compute_context* context);

   std::shared_ptr<neural_net::Publisher<TrainingOutputBatch>>
   AsTrainingBatchPublisher(std::unique_ptr<data_iterator> training_data,
                            size_t batch_size, int offset) override;

   std::shared_ptr<neural_net::Publisher<EncodedBatch>>
   AsInferenceBatchPublisher(std::unique_ptr<data_iterator> test_data,
                             size_t batch_size, float confidence_threshold,
                             float iou_threshold) override;

   InferenceOutputBatch DecodeOutputBatch(EncodedBatch batch,
                                          float confidence_threshold,
                                          float iou_threshold) override;

   std::shared_ptr<neural_net::Publisher<std::unique_ptr<Checkpoint>>>
   AsCheckpointPublisher() override;

  protected:
   std::shared_ptr<neural_net::Publisher<TrainingOutputBatch>>
   AsTrainingBatchPublisher(std::shared_ptr<neural_net::Publisher<InputBatch>>
                                augmented_data) override;

  private:
   Config config_;
   std::shared_ptr<neural_net::model_backend> backend_;
   std::shared_ptr<DataAugmenter> training_augmenter_;
   std::shared_ptr<DataAugmenter> inference_augmenter_;
 };

 }  // namespace object_detection
 }  // namespace turi

 #endif  // TOOLKITS_OBJECT_DETECTION_OD_DARKNET_YOLO_MODEL_TRAINER_HPP_
od_model_trainer.hpp

turi::object_detection::Checkpoint
Definition: od_model_trainer.hpp:159

turi::object_detection::DecodeDarknetYOLOInference
InferenceOutputBatch DecodeDarknetYOLOInference(EncodedBatch batch, float confidence_threshold, float iou_threshold)

turi::object_detection::DarknetYOLOBackendTrainingWrapper
Definition: od_darknet_yolo_model_trainer.hpp:62

turi::neural_net::Transform
Definition: combine_base.hpp:48

turi::object_detection::DarknetYOLOCheckpointer::HasNext
bool HasNext() const override
Definition: od_darknet_yolo_model_trainer.hpp:114

turi::object_detection::DarknetYOLOCheckpoint
Definition: od_darknet_yolo_model_trainer.hpp:127

turi::object_detection::DarknetYOLOModelTrainer
Definition: od_darknet_yolo_model_trainer.hpp:166

turi::object_detection::ModelTrainer
Definition: od_model_trainer.hpp:252

turi::object_detection::EncodedInputBatch
Definition: od_model_trainer.hpp:56

turi::object_detection::DarknetYOLOBackendInferenceWrapper
Definition: od_darknet_yolo_model_trainer.hpp:91

turi::object_detection::Config
Definition: od_model_trainer.hpp:108

turi
SKD.
Definition: capi_initialization.hpp:11

turi::object_detection::DarknetYOLOInferenceAugmentationOptions
neural_net::image_augmenter::options DarknetYOLOInferenceAugmentationOptions(int batch_size, int output_height, int output_width)

turi::neural_net::compute_context
Definition: compute_context.hpp:55

turi::object_detection::TrainingOutputBatch
Definition: od_model_trainer.hpp:73

turi::neural_net::pipeline_spec
Definition: model_spec.hpp:567

turi::object_detection::DarknetYOLOTrainingAugmentationOptions
neural_net::image_augmenter::options DarknetYOLOTrainingAugmentationOptions(int batch_size, int output_height, int output_width)

turi::neural_net::Publisher
Definition: combine_base.hpp:214

turi::neural_net::Iterator
Definition: combine_iterator.hpp:31

turi::object_detection::EncodeDarknetYOLO
EncodedInputBatch EncodeDarknetYOLO(InputBatch input_batch, size_t output_height, size_t output_width, size_t num_anchors, size_t num_classes)

turi::object_detection::DarknetYOLOCheckpointer
Definition: od_darknet_yolo_model_trainer.hpp:107

turi::object_detection::EncodedBatch
Definition: od_model_trainer.hpp:88

turi::object_detection::CheckpointMetadata
Definition: od_model_trainer.hpp:134

turi::object_detection::InferenceOutputBatch
Definition: od_model_trainer.hpp:98