clearml/trains/automation/optuna/optuna.py

from time import sleep, time
from typing import Any, Optional, Sequence

from ..optimization import Objective, SearchStrategy
from ..parameters import (
    DiscreteParameterRange, UniformParameterRange, RandomSeed, UniformIntegerParameterRange, Parameter, )
from ...task import Task

try:
    # noinspection PyPackageRequirements
    import optuna
    Task.add_requirements('optuna')
except ImportError:
    raise ImportError("OptimizerOptuna requires 'optuna' package, it was not found\n"
                      "install with: pip install optuna")


class OptunaObjective(object):
    def __init__(self, base_task_id, queue_name, optimizer, max_iteration_per_job, sleep_interval, config_space):
        # type: (str, str, OptimizerOptuna, int, float, dict) -> None
        self.base_task_id = base_task_id
        self.optimizer = optimizer
        self.queue_name = queue_name
        self.sleep_interval = sleep_interval
        self.max_iteration_per_job = max_iteration_per_job
        self._config_space = config_space

    def objective(self, trial):
        # type: (optuna.Trial) -> float
        """
        return metric value for a specified set of parameter, pulled from the trail object

        :param optuna.Trial trial: optuna.Trial object
        :return: metric value float
        """
        parameter_override = {}
        for name, (func_name, params) in self._config_space.items():
            suggest = getattr(trial, func_name)
            parameter_override[name] = suggest(name=name, **params)

        current_job = self.optimizer.helper_create_job(self.base_task_id, parameter_override=parameter_override)
        # noinspection PyProtectedMember
        self.optimizer._current_jobs.append(current_job)
        current_job.launch(self.queue_name)
        iteration_value = None
        is_pending = True

        while not current_job.is_stopped():
            if is_pending and not current_job.is_pending():
                is_pending = False

            if not is_pending:
                # noinspection PyProtectedMember
                iteration_value = self.optimizer._objective_metric.get_current_raw_objective(current_job)

                if iteration_value:
                    # update budget
                    trial.report(value=iteration_value[1], step=iteration_value[0])

                    # Handle pruning based on the intermediate value.
                    if trial.should_prune():
                        current_job.abort()
                        raise optuna.TrialPruned()

                    # check if we exceeded this job budget
                    if self.max_iteration_per_job and iteration_value[0] >= self.max_iteration_per_job:
                        current_job.abort()
                        break

            sleep(self.sleep_interval)

        # noinspection PyProtectedMember
        objective_metric = self.optimizer._objective_metric.get_objective(current_job)
        print('OptunaObjective result metric={}, iteration {}'.format(objective_metric, iteration_value))
        # noinspection PyProtectedMember
        self.optimizer._current_jobs.remove(current_job)
        return objective_metric


class OptimizerOptuna(SearchStrategy):
    def __init__(
            self,
            base_task_id,  # type: str
            hyper_parameters,  # type: Sequence[Parameter]
            objective_metric,  # type: Objective
            execution_queue,  # type: str
            num_concurrent_workers,  # type: int
            max_iteration_per_job,  # type: Optional[int]
            total_max_jobs,  # type: Optional[int]
            pool_period_min=2.,  # type: float
            time_limit_per_job=None,  # type: Optional[float]
            optuna_sampler=None,  # type: Optional[optuna.samplers.base]
            optuna_pruner=None,  # type: Optional[optuna.pruners.base]
            continue_previous_study=None,  # type: Optional[optuna.Study]
            **optuna_kwargs  # type: Any
    ):
        # type: (...) -> None
        """
        Initialize am Optuna search strategy optimizer
        Optuna performs robust and efficient hyperparameter optimization at scale by combining.
        Specific hyper-parameter pruning strategy can be selected via `sampler` and `pruner` argyments

        :param str base_task_id: Task ID (str)
        :param list hyper_parameters: list of Parameter objects to optimize over
        :param Objective objective_metric: Objective metric to maximize / minimize
        :param str execution_queue: execution queue to use for launching Tasks (experiments).
        :param int num_concurrent_workers: Limit number of concurrent running Tasks (machines)
        :param int max_iteration_per_job: number of iteration per job
            'iterations' are the reported iterations for the specified objective,
            not the maximum reported iteration of the Task.
        :param int total_max_jobs: total maximum job for the optimization process.
            Must be provided in order to calculate the total budget for the optimization process.
            The total budget is measured by "iterations" (see above)
            and will be set to `max_iteration_per_job * total_max_jobs`
            This means more than total_max_jobs could be created, as long as the cumulative iterations
            (summed over all created jobs) will not exceed `max_iteration_per_job * total_max_jobs`
        :param float pool_period_min: time in minutes between two consecutive pools
        :param float time_limit_per_job: Optional, maximum execution time per single job in minutes,
            when time limit is exceeded job is aborted
        :param optuna_kwargs: arguments passed directly to the Optuna object
        """
        super(OptimizerOptuna, self).__init__(
            base_task_id=base_task_id, hyper_parameters=hyper_parameters, objective_metric=objective_metric,
            execution_queue=execution_queue, num_concurrent_workers=num_concurrent_workers,
            pool_period_min=pool_period_min, time_limit_per_job=time_limit_per_job,
            max_iteration_per_job=max_iteration_per_job, total_max_jobs=total_max_jobs)
        self._optuna_sampler = optuna_sampler
        self._optuna_pruner = optuna_pruner
        verified_optuna_kwargs = []
        self._optuna_kwargs = dict((k, v) for k, v in optuna_kwargs.items() if k in verified_optuna_kwargs)
        self._param_iterator = None
        self._objective = None
        self._study = continue_previous_study if continue_previous_study else None

    def start(self):
        # type: () -> ()
        """
        Start the Optimizer controller function loop()
        If the calling process is stopped, the controller will stop as well.

        .. important::
            This function returns only after optimization is completed or :meth:`stop` was called.

        """
        self._study = optuna.create_study(
            direction="minimize" if self._objective_metric.get_objective_sign() < 0 else "maximize",
            load_if_exists=False,
            sampler=self._optuna_sampler,
            pruner=self._optuna_pruner,
            study_name=self._optimizer_task.id if self._optimizer_task else None,
        )
        config_space = self._convert_hyper_parameters_to_optuna()
        self._objective = OptunaObjective(
            base_task_id=self._base_task_id,
            queue_name=self._execution_queue,
            optimizer=self,
            max_iteration_per_job=self.max_iteration_per_job,
            sleep_interval=int(self.pool_period_minutes * 60),
            config_space=config_space,
        )
        self._study.optimize(
            self._objective.objective, n_trials=self.total_max_jobs, n_jobs=self._num_concurrent_workers)

    def stop(self):
        # type: () -> ()
        """
        Stop the current running optimization loop,
        Called from a different thread than the :meth:`start`.
        """
        if self._study:
            try:
                self._study.stop()
            except Exception as ex:
                print(ex)

    def _convert_hyper_parameters_to_optuna(self):
        # type: () -> dict
        cs = {}
        for p in self._hyper_parameters:
            if isinstance(p, UniformParameterRange):
                if p.include_max and p.step_size:
                    hp_type = 'suggest_discrete_uniform'
                    hp_params = dict(low=p.min_value, high=p.max_value, q=p.step_size)
                else:
                    hp_type = 'suggest_float'
                    hp_params = dict(low=p.min_value, high=p.max_value, log=False, step=p.step_size)
            elif isinstance(p, UniformIntegerParameterRange):
                hp_type = 'suggest_int'
                hp_params = dict(low=p.min_value, high=p.max_value if p.include_max else p.max_value - p.step_size,
                                 log=False, step=p.step_size)
            elif isinstance(p, DiscreteParameterRange):
                hp_type = 'suggest_categorical'
                hp_params = dict(choices=p.values)
            else:
                raise ValueError("HyperParameter type {} not supported yet with OptimizerBOHB".format(type(p)))
            cs[p.name] = (hp_type, hp_params)

        return cs
Add Optimizer set_optimizer_task and OptimizerOptuna 2020-07-14 20:36:50 +00:00			`from time import sleep, time`
			`from typing import Any, Optional, Sequence`

			`from ..optimization import Objective, SearchStrategy`
			`from ..parameters import (`
			`DiscreteParameterRange, UniformParameterRange, RandomSeed, UniformIntegerParameterRange, Parameter, )`
			`from ...task import Task`

			`try:`
			`# noinspection PyPackageRequirements`
			`import optuna`
			`Task.add_requirements('optuna')`
			`except ImportError:`
Fix Optuna and HPBandster optimizers to ignore extra kwargs in constructor. Use OptimizerOptuna as default optimizer for hyper-parameter optimization example. 2020-07-30 11:56:15 +00:00			`raise ImportError("OptimizerOptuna requires 'optuna' package, it was not found\n"`
			`"install with: pip install optuna")`
Add Optimizer set_optimizer_task and OptimizerOptuna 2020-07-14 20:36:50 +00:00

			`class OptunaObjective(object):`
			`def __init__(self, base_task_id, queue_name, optimizer, max_iteration_per_job, sleep_interval, config_space):`
			`# type: (str, str, OptimizerOptuna, int, float, dict) -> None`
			`self.base_task_id = base_task_id`
			`self.optimizer = optimizer`
			`self.queue_name = queue_name`
			`self.sleep_interval = sleep_interval`
			`self.max_iteration_per_job = max_iteration_per_job`
			`self._config_space = config_space`

			`def objective(self, trial):`
			`# type: (optuna.Trial) -> float`
			`"""`
			`return metric value for a specified set of parameter, pulled from the trail object`

			`:param optuna.Trial trial: optuna.Trial object`
			`:return: metric value float`
			`"""`
			`parameter_override = {}`
			`for name, (func_name, params) in self._config_space.items():`
			`suggest = getattr(trial, func_name)`
			`parameter_override[name] = suggest(name=name, **params)`

			`current_job = self.optimizer.helper_create_job(self.base_task_id, parameter_override=parameter_override)`
			`# noinspection PyProtectedMember`
			`self.optimizer._current_jobs.append(current_job)`
			`current_job.launch(self.queue_name)`
			`iteration_value = None`
			`is_pending = True`

			`while not current_job.is_stopped():`
			`if is_pending and not current_job.is_pending():`
			`is_pending = False`

			`if not is_pending:`
			`# noinspection PyProtectedMember`
			`iteration_value = self.optimizer._objective_metric.get_current_raw_objective(current_job)`

			`if iteration_value:`
			`# update budget`
			`trial.report(value=iteration_value[1], step=iteration_value[0])`

			`# Handle pruning based on the intermediate value.`
			`if trial.should_prune():`
			`current_job.abort()`
			`raise optuna.TrialPruned()`

			`# check if we exceeded this job budget`
			`if self.max_iteration_per_job and iteration_value[0] >= self.max_iteration_per_job:`
			`current_job.abort()`
			`break`

			`sleep(self.sleep_interval)`

			`# noinspection PyProtectedMember`
			`objective_metric = self.optimizer._objective_metric.get_objective(current_job)`
			`print('OptunaObjective result metric={}, iteration {}'.format(objective_metric, iteration_value))`
			`# noinspection PyProtectedMember`
			`self.optimizer._current_jobs.remove(current_job)`
			`return objective_metric`


			`class OptimizerOptuna(SearchStrategy):`
			`def __init__(`
			`self,`
			`base_task_id, # type: str`
			`hyper_parameters, # type: Sequence[Parameter]`
			`objective_metric, # type: Objective`
			`execution_queue, # type: str`
			`num_concurrent_workers, # type: int`
			`max_iteration_per_job, # type: Optional[int]`
			`total_max_jobs, # type: Optional[int]`
			`pool_period_min=2., # type: float`
			`time_limit_per_job=None, # type: Optional[float]`
			`optuna_sampler=None, # type: Optional[optuna.samplers.base]`
			`optuna_pruner=None, # type: Optional[optuna.pruners.base]`
			`continue_previous_study=None, # type: Optional[optuna.Study]`
Fix Optuna and HPBandster optimizers to ignore extra kwargs in constructor. Use OptimizerOptuna as default optimizer for hyper-parameter optimization example. 2020-07-30 11:56:15 +00:00			`**optuna_kwargs # type: Any`
Add Optimizer set_optimizer_task and OptimizerOptuna 2020-07-14 20:36:50 +00:00			`):`
			`# type: (...) -> None`
			`"""`
			`Initialize am Optuna search strategy optimizer`
			`Optuna performs robust and efficient hyperparameter optimization at scale by combining.`
			Specific hyper-parameter pruning strategy can be selected via `sampler` and `pruner` argyments

			`:param str base_task_id: Task ID (str)`
			`:param list hyper_parameters: list of Parameter objects to optimize over`
			`:param Objective objective_metric: Objective metric to maximize / minimize`
			`:param str execution_queue: execution queue to use for launching Tasks (experiments).`
			`:param int num_concurrent_workers: Limit number of concurrent running Tasks (machines)`
			`:param int max_iteration_per_job: number of iteration per job`
			`'iterations' are the reported iterations for the specified objective,`
			`not the maximum reported iteration of the Task.`
			`:param int total_max_jobs: total maximum job for the optimization process.`
			`Must be provided in order to calculate the total budget for the optimization process.`
			`The total budget is measured by "iterations" (see above)`
			and will be set to `max_iteration_per_job * total_max_jobs`
			`This means more than total_max_jobs could be created, as long as the cumulative iterations`
			(summed over all created jobs) will not exceed `max_iteration_per_job * total_max_jobs`
			`:param float pool_period_min: time in minutes between two consecutive pools`
			`:param float time_limit_per_job: Optional, maximum execution time per single job in minutes,`
			`when time limit is exceeded job is aborted`
			`:param optuna_kwargs: arguments passed directly to the Optuna object`
			`"""`
			`super(OptimizerOptuna, self).__init__(`
			`base_task_id=base_task_id, hyper_parameters=hyper_parameters, objective_metric=objective_metric,`
			`execution_queue=execution_queue, num_concurrent_workers=num_concurrent_workers,`
			`pool_period_min=pool_period_min, time_limit_per_job=time_limit_per_job,`
			`max_iteration_per_job=max_iteration_per_job, total_max_jobs=total_max_jobs)`
			`self._optuna_sampler = optuna_sampler`
			`self._optuna_pruner = optuna_pruner`
Fix Optuna and HPBandster optimizers to ignore extra kwargs in constructor. Use OptimizerOptuna as default optimizer for hyper-parameter optimization example. 2020-07-30 11:56:15 +00:00			`verified_optuna_kwargs = []`
			`self._optuna_kwargs = dict((k, v) for k, v in optuna_kwargs.items() if k in verified_optuna_kwargs)`
Add Optimizer set_optimizer_task and OptimizerOptuna 2020-07-14 20:36:50 +00:00			`self._param_iterator = None`
			`self._objective = None`
			`self._study = continue_previous_study if continue_previous_study else None`

			`def start(self):`
			`# type: () -> ()`
			`"""`
			`Start the Optimizer controller function loop()`
			`If the calling process is stopped, the controller will stop as well.`

			`.. important::`
			This function returns only after optimization is completed or :meth:`stop` was called.

			`"""`
			`self._study = optuna.create_study(`
			`direction="minimize" if self._objective_metric.get_objective_sign() < 0 else "maximize",`
			`load_if_exists=False,`
			`sampler=self._optuna_sampler,`
			`pruner=self._optuna_pruner,`
			`study_name=self._optimizer_task.id if self._optimizer_task else None,`
			`)`
			`config_space = self._convert_hyper_parameters_to_optuna()`
			`self._objective = OptunaObjective(`
			`base_task_id=self._base_task_id,`
			`queue_name=self._execution_queue,`
			`optimizer=self,`
			`max_iteration_per_job=self.max_iteration_per_job,`
			`sleep_interval=int(self.pool_period_minutes * 60),`
			`config_space=config_space,`
			`)`
			`self._study.optimize(`
			`self._objective.objective, n_trials=self.total_max_jobs, n_jobs=self._num_concurrent_workers)`

			`def stop(self):`
			`# type: () -> ()`
			`"""`
			`Stop the current running optimization loop,`
			Called from a different thread than the :meth:`start`.
			`"""`
			`if self._study:`
			`try:`
			`self._study.stop()`
			`except Exception as ex:`
			`print(ex)`

			`def _convert_hyper_parameters_to_optuna(self):`
			`# type: () -> dict`
			`cs = {}`
			`for p in self._hyper_parameters:`
			`if isinstance(p, UniformParameterRange):`
			`if p.include_max and p.step_size:`
			`hp_type = 'suggest_discrete_uniform'`
			`hp_params = dict(low=p.min_value, high=p.max_value, q=p.step_size)`
			`else:`
			`hp_type = 'suggest_float'`
			`hp_params = dict(low=p.min_value, high=p.max_value, log=False, step=p.step_size)`
			`elif isinstance(p, UniformIntegerParameterRange):`
			`hp_type = 'suggest_int'`
			`hp_params = dict(low=p.min_value, high=p.max_value if p.include_max else p.max_value - p.step_size,`
			`log=False, step=p.step_size)`
			`elif isinstance(p, DiscreteParameterRange):`
			`hp_type = 'suggest_categorical'`
			`hp_params = dict(choices=p.values)`
			`else:`
			`raise ValueError("HyperParameter type {} not supported yet with OptimizerBOHB".format(type(p)))`
			`cs[p.name] = (hp_type, hp_params)`

			`return cs`