Source code for mushroom_rl_benchmark.core.suite

import mushroom_rl_benchmark.builders
from mushroom_rl_benchmark.builders import EnvironmentBuilder
from mushroom_rl_benchmark.core.experiment import BenchmarkExperiment
from mushroom_rl_benchmark.core.logger import BenchmarkLogger
from mushroom_rl_benchmark.core.suite_visualizer import BenchmarkSuiteVisualizer



[docs]
class BenchmarkSuite:
    """
    Class to orchestrate the execution of multiple experiments.

    """

[docs]
    def __init__(self, log_dir=None, log_id=None, use_timestamp=True, parallel=None, slurm=None):
        """
        Constructor.

        Args:
            log_dir (str): path to the log directory (Default: ./logs or /work/scratch/$USER)
            log_id (str): log id (Default: benchmark[_YYYY-mm-dd-HH-MM-SS])
            use_timestamp (bool): select if a timestamp should be appended to the log id
            parallel (dict, None): parameters that are passed to the run_parallel method of the experiment
            slurm (dict, None): parameters that are passed to the run_slurm method of the experiment
        
        """
        self._experiment_structure = dict()
        self._environment_dict = dict()
        self._parameters_dict = dict()
        self._parallel = parallel
        self._slurm = slurm
        self._is_sweep = None
        self.logger = BenchmarkLogger(log_dir=log_dir, log_id=log_id, use_timestamp=use_timestamp)



[docs]
    def add_experiments(self, environment_name, environment_builder_params, agent_names_list,
                        agent_builders_params, **run_params):
        """
        Add a set of experiments for the same environment to the suite.

        Args:
            environment_name (str): name of the environment for the experiment (E.g. Gym.Pendulum-v0);
            environment_builder_params (dict): parameters for the environment builder;
            agent_names_list (list): list of names of the agents for the experiments;
            agent_builders_params (list): list of dictionaries containing the parameters for the agent builder;
            run_params: Parameters that are passed to the run method of the experiment.

        """
        assert self._is_sweep is False or self._is_sweep is None
        self._is_sweep = False

        self.add_environment(environment_name, environment_builder_params, **run_params)

        for agent_name, agent_params in zip(agent_names_list, agent_builders_params):
            self.add_agent(environment_name, agent_name, agent_params)



[docs]
    def add_experiments_sweeps(self, environment_name, environment_builder_params, agent_names_list,
                               agent_builders_params, sweeps_list, **run_params):
        """
        Add a set of experiments sweeps for the same environment to the suite.

        Args:
            environment_name (str): name of the environment for the experiment (E.g. Gym.Pendulum-v0);
            environment_builder_params (dict): parameters for the environment builder;
            agent_names_list (list): list of names of the agents for the experiments;
            agent_builders_params (list): list of dictionaries containing the parameters for the agent builder;
            sweeps_list (list): list of dictionaries containing the parameter sweep to be executed;
            run_params: Parameters that are passed to the run method of the experiment.

        """
        assert self._is_sweep is True or self._is_sweep is None
        self._is_sweep = True

        self.add_environment(environment_name, environment_builder_params, **run_params)

        for agent_name, agent_params, sweep_dict in zip(agent_names_list, agent_builders_params, sweeps_list):
            self.add_sweep(environment_name, agent_name, agent_params, sweep_dict)



[docs]
    def add_environment(self, environment_name, environment_builder_params, **run_params):
        """
        Add an environment to the benchmarking suite.

        Args:
            environment_name (str): name of the environment for the experiment (E.g. Gym.Pendulum-v0);
            environment_builder_params (dict): parameters for the environment builder;
            run_params: Parameters that are passed to the run method of the experiment.

        """
        if environment_name in self._environment_dict:
            raise AttributeError(f'The environment {environment_name} has been already added to the benchmark')

        if environment_builder_params is None:
            environment_builder_params = dict()

        self._environment_dict[environment_name] = dict(
            build_params=environment_builder_params,
            run_params=run_params
        )

        self._experiment_structure[environment_name] = dict()



[docs]
    def add_agent(self, environment_name, agent_name, agent_params):
        """
        Add an agent to the benchmarking suite.

        Args:
            environment_name (str): name of the environment for the experiment (E.g. Gym.Pendulum-v0);
            agent_name (str): name of the agent for the experiments;
            agent_params (list): dictionary containing the parameters for the agent builder.

        """
        assert environment_name in self._environment_dict
        assert self._is_sweep is False or self._is_sweep is None
        self._is_sweep = False
        if agent_name in self._experiment_structure[environment_name]:
            raise AttributeError(
                f'An experiment for environment {environment_name} and builders {agent_name} already exists.'
            )

        environment_builder_params = self._environment_dict[environment_name]['build_params']

        try:
            exp = self._create_experiment(environment_name, environment_builder_params, agent_name, agent_params)
            self._experiment_structure[environment_name][agent_name] = exp
        except AttributeError as e:
            self.logger.error(
                f'Unable to create experiment for the environment {environment_name} and agent {agent_name}'
            )
            self.logger.exception(e)



[docs]
    def add_sweep(self, environment_name, agent_name, agent_params, sweep_dict):
        """
        Add an agent sweep to the benchmarking suite.

        Args:
            environment_name (str): name of the environment for the experiment (E.g. Gym.Pendulum-v0);
            agent_name (str): name of the agent for the experiments;
            agent_params (list): dictionary containing the parameters for the agent builder;
            sweep_dict (dict): dictionary with the sweep configurations.

        """
        assert environment_name in self._environment_dict
        assert self._is_sweep is True or self._is_sweep is None
        self._is_sweep = True

        for sweep_key, sweep_params in sweep_dict.items():
            sweep_name = agent_name + '_' + sweep_key
            if sweep_name in self._experiment_structure[environment_name]:
                raise AttributeError(
                    f'An sweep for environment {environment_name}, builders {agent_name} '
                    f'and sweep key {sweep_key} already exists.'
                )

            environment_builder_params = self._environment_dict[environment_name]['build_params']

            try:
                exp = self._create_experiment_sweep(environment_name, environment_builder_params,
                                                    agent_name, agent_params, sweep_key, sweep_params)
                self._experiment_structure[environment_name][sweep_name] = exp
            except AttributeError as e:
                self.logger.error(
                    f'Unable to create sweep for environment {environment_name}, agent {agent_name} '
                    f'and sweep key {sweep_key}'
                )
                self.logger.exception(e)



[docs]
    def run(self, exec_type='sequential'):
        """
        Run all experiments in the suite.

        """
        for environment, agents in self._experiment_structure.items():
            for agent, exp in agents.items():
                self.logger.info(f'Starting Experiment for {agent} on {environment}')
                run_params = self._environment_dict[environment]['run_params']
                exp.run(exec_type=exec_type, parallel=self._parallel, slurm=self._slurm, **run_params)



[docs]
    def print_experiments(self):
        """
        Print the experiments in the suite.

        """
        first = True
        for env, agents in self._experiment_structure.items():
            if not first:
                self.logger.weak_line()
            first = False
            self.logger.info(f'Environment: {env}')
            for agent, _ in agents.items():
                self.logger.info('- ' + agent)



[docs]
    def save_parameters(self):
        """
        Save the experiment parameters in yaml files inside the parameters folder

        """
        for env, params in self._parameters_dict.items():
            self.logger.save_params(env, params)



[docs]
    def save_plots(self, **plot_params):
        """
        Save the result plots to the log directory.

        Args:
            **plot_params: parameters to be passed to the suite visualizer.

        """
        visualizer = BenchmarkSuiteVisualizer(self.logger, self._is_sweep, **plot_params)
        visualizer.save_reports()



[docs]
    def show_plots(self, **plot_params):
        """
        Display the result plots.

        Args:
            **plot_params: parameters to be passed to the suite visualizer.

        """
        visualizer = BenchmarkSuiteVisualizer(self.logger, self._is_sweep, **plot_params)
        visualizer.show_report()


    def _create_experiment(self, environment, environment_params, agent_name, agent_builder_params):
        environment_id = self._get_env_id(environment)

        logger = BenchmarkLogger(
            log_dir=self.logger.get_path(),
            log_id=f'{environment_id}/{agent_name}',
            use_timestamp=False
        )

        return self._create_experiment_base(agent_builder_params, agent_name, environment,
                                            environment_id, environment_params, logger)

    def _create_experiment_sweep(self, environment, environment_params, agent_name, agent_builder_params, sweep_key,
                                 sweep_params):
        environment_id = self._get_env_id(environment)

        logger = BenchmarkLogger(
            log_dir=self.logger.get_path(),
            log_id=f'{environment_id}/{agent_name}/{sweep_key}',
            use_timestamp=False
        )

        agent_sweep_params = agent_builder_params.copy()
        agent_sweep_params.update(sweep_params)

        return self._create_experiment_base(agent_sweep_params, agent_name, environment,
                                            environment_id, environment_params, logger, sweep_key)

    def _create_experiment_base(self, agent_builder_params, agent_name, environment, environment_id,
                                environment_params, logger, sweep_key=None):
        builder = getattr(mushroom_rl_benchmark.builders, f'{agent_name}Builder')
        agent_builder, agent_params = builder.default(get_default_dict=True, **agent_builder_params)
        env_builder = EnvironmentBuilder(environment, environment_params)
        self._add_parameters(agent_name, sweep_key, environment_id, agent_params)
        return BenchmarkExperiment(agent_builder, env_builder, logger)

    def _add_parameters(self, agent_name, sweep_key, environment_id, params):

        if environment_id not in self._parameters_dict:
            self._parameters_dict[environment_id] = dict()

        del params['cls']
        if 'use_cuda' in params:
            del params['use_cuda']
        del params['get_default_dict']

        if sweep_key is None:
            self._parameters_dict[environment_id][agent_name] = params
        else:
            if agent_name not in self._parameters_dict[environment_id]:
                self._parameters_dict[environment_id][agent_name] = dict()
            self._parameters_dict[environment_id][agent_name][sweep_key] = params

    @staticmethod
    def _get_env_id(environment):
        separator = '.'

        if separator in environment:
            splitted = environment.split(separator)
            return '_'.join(splitted[1:])
        else:
            return environment