clearml-server/server/tests/automated/test_task_events.py

"""
Comprehensive test of all(?) use cases of datasets and frames
"""
import json
import time
import unittest
from statistics import mean

from typing import Sequence

import es_factory
from config import config
from tests.automated import TestService

log = config.logger(__file__)


class TestTaskEvents(TestService):
    def setUp(self, version="1.7"):
        super().setUp(version=version)

    def _temp_task(self, name="test task events"):
        task_input = dict(
            name=name, type="training", input=dict(mapping={}, view=dict(entries=[])),
        )
        return self.create_temp("tasks", **task_input)

    def _create_task_event(self, type_, task, iteration):
        return {
            "worker": "test",
            "type": type_,
            "task": task,
            "iter": iteration,
            "timestamp": es_factory.get_timestamp_millis(),
        }

    def _copy_and_update(self, src_obj, new_data):
        obj = src_obj.copy()
        obj.update(new_data)
        return obj

    def test_task_logs(self):
        events = []
        task = self._temp_task()
        for iter_ in range(10):
            log_event = self._create_task_event("log", task, iteration=iter_)
            events.append(
                self._copy_and_update(
                    log_event,
                    {"msg": "This is a log message from test task iter " + str(iter_)},
                )
            )
            # sleep so timestamp is not the same
            time.sleep(0.01)
        self.send_batch(events)

        data = self.api.events.get_task_log(task=task)
        assert len(data["events"]) == 10

        self.api.tasks.reset(task=task)
        data = self.api.events.get_task_log(task=task)
        assert len(data["events"]) == 0

    def test_task_metric_value_intervals_keys(self):
        metric = "Metric1"
        variant = "Variant1"
        iter_count = 100
        task = self._temp_task()
        events = [
            {
                **self._create_task_event("training_stats_scalar", task, iteration),
                "metric": metric,
                "variant": variant,
                "value": iteration,
            }
            for iteration in range(iter_count)
        ]
        self.send_batch(events)
        for key in None, "iter", "timestamp", "iso_time":
            with self.subTest(key=key):
                data = self.api.events.scalar_metrics_iter_histogram(task=task, key=key)
                self.assertIn(metric, data)
                self.assertIn(variant, data[metric])
                self.assertIn("x", data[metric][variant])
                self.assertIn("y", data[metric][variant])

    def test_multitask_events_many_metrics(self):
        tasks = [
            self._temp_task(name="test events1"),
            self._temp_task(name="test events2"),
        ]
        iter_count = 10
        metrics_count = 10
        variants_count = 10
        events = [
            {
                **self._create_task_event("training_stats_scalar", task, iteration),
                "metric": f"Metric{metric_idx}",
                "variant": f"Variant{variant_idx}",
                "value": iteration,
            }
            for iteration in range(iter_count)
            for task in tasks
            for metric_idx in range(metrics_count)
            for variant_idx in range(variants_count)
        ]
        self.send_batch(events)
        data = self.api.events.multi_task_scalar_metrics_iter_histogram(tasks=tasks)
        self._assert_metrics_and_variants(
            data.metrics,
            metrics=metrics_count,
            variants=variants_count,
            tasks=tasks,
            iterations=iter_count,
        )

    def _assert_metrics_and_variants(
        self, data: dict, metrics: int, variants: int, tasks: Sequence, iterations: int
    ):
        self.assertEqual(len(data), metrics)
        for m in range(metrics):
            metric_data = data[f"Metric{m}"]
            self.assertEqual(len(metric_data), variants)
            for v in range(variants):
                variant_data = metric_data[f"Variant{v}"]
                self.assertEqual(len(variant_data), len(tasks))
                for t in tasks:
                    task_data = variant_data[t]
                    self.assertEqual(len(task_data["x"]), iterations)
                    self.assertEqual(len(task_data["y"]), iterations)

    def test_task_metric_value_intervals(self):
        metric = "Metric1"
        variant = "Variant1"
        iter_count = 100
        task = self._temp_task()
        events = [
            {
                **self._create_task_event("training_stats_scalar", task, iteration),
                "metric": metric,
                "variant": variant,
                "value": iteration,
            }
            for iteration in range(iter_count)
        ]
        self.send_batch(events)

        data = self.api.events.scalar_metrics_iter_histogram(task=task)
        self._assert_metrics_histogram(data[metric][variant], iter_count, 100)

        data = self.api.events.scalar_metrics_iter_histogram(task=task, samples=100)
        self._assert_metrics_histogram(data[metric][variant], iter_count, 100)

        data = self.api.events.scalar_metrics_iter_histogram(task=task, samples=10)
        self._assert_metrics_histogram(data[metric][variant], iter_count, 10)

    def _assert_metrics_histogram(self, data, iters, samples):
        interval = iters // samples
        self.assertEqual(len(data["x"]), samples)
        self.assertEqual(len(data["y"]), samples)
        for curr in range(samples):
            self.assertEqual(data["x"][curr], curr * interval)
            self.assertEqual(
                data["y"][curr],
                mean(v for v in range(curr * interval, (curr + 1) * interval)),
            )

    def test_task_plots(self):
        task = self._temp_task()
        event = self._create_task_event("plot", task, 0)
        event["metric"] = "roc"
        event.update(
            {
                "plot_str": json.dumps(
                    {
                        "data": [
                            {
                                "x": [0, 1, 2, 3, 4, 5, 6, 7, 8],
                                "y": [0, 1, 2, 3, 4, 5, 6, 7, 8],
                                "text": [
                                    "Th=0.1",
                                    "Th=0.2",
                                    "Th=0.3",
                                    "Th=0.4",
                                    "Th=0.5",
                                    "Th=0.6",
                                    "Th=0.7",
                                    "Th=0.8",
                                ],
                                "name": "class1",
                            },
                            {
                                "x": [0, 1, 2, 3, 4, 5, 6, 7, 8],
                                "y": [2.0, 3.0, 5.0, 8.2, 6.4, 7.5, 9.2, 8.1, 10.0],
                                "text": [
                                    "Th=0.1",
                                    "Th=0.2",
                                    "Th=0.3",
                                    "Th=0.4",
                                    "Th=0.5",
                                    "Th=0.6",
                                    "Th=0.7",
                                    "Th=0.8",
                                ],
                                "name": "class2",
                            },
                        ],
                        "layout": {
                            "title": "ROC for iter 0",
                            "xaxis": {"title": "my x axis"},
                            "yaxis": {"title": "my y axis"},
                        },
                    }
                )
            }
        )
        self.send(event)

        event = self._create_task_event("plot", task, 100)
        event["metric"] = "confusion"
        event.update(
            {
                "plot_str": json.dumps(
                    {
                        "data": [
                            {
                                "y": [
                                    "lying",
                                    "sitting",
                                    "standing",
                                    "people",
                                    "backgroun",
                                ],
                                "x": [
                                    "lying",
                                    "sitting",
                                    "standing",
                                    "people",
                                    "backgroun",
                                ],
                                "z": [
                                    [758, 163, 0, 0, 23],
                                    [63, 858, 3, 0, 0],
                                    [0, 50, 188, 21, 35],
                                    [0, 22, 8, 40, 4],
                                    [12, 91, 26, 29, 368],
                                ],
                                "type": "heatmap",
                            }
                        ],
                        "layout": {
                            "title": "Confusion Matrix for iter 100",
                            "xaxis": {"title": "Predicted value"},
                            "yaxis": {"title": "Real value"},
                        },
                    }
                )
            }
        )
        self.send(event)

        data = self.api.events.get_task_plots(task=task)
        assert len(data["plots"]) == 2

        self.api.tasks.reset(task=task)
        data = self.api.events.get_task_plots(task=task)
        assert len(data["plots"]) == 0

    def send_batch(self, events):
        self.api.send_batch("events.add_batch", events)

    def send(self, event):
        self.api.send("events.add", event)


if __name__ == "__main__":
    unittest.main()
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`"""`
			`Comprehensive test of all(?) use cases of datasets and frames`
			`"""`
			`import json`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`import time`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`import unittest`
			`from statistics import mean`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`from typing import Sequence`

Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`import es_factory`
			`from config import config`
			`from tests.automated import TestService`

			`log = config.logger(__file__)`


			`class TestTaskEvents(TestService):`
			`def setUp(self, version="1.7"):`
			`super().setUp(version=version)`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`def _temp_task(self, name="test task events"):`
			`task_input = dict(`
			`name=name, type="training", input=dict(mapping={}, view=dict(entries=[])),`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`)`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`return self.create_temp("tasks", **task_input)`

			`def _create_task_event(self, type_, task, iteration):`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`return {`
			`"worker": "test",`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`"type": type_,`
			`"task": task,`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`"iter": iteration,`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`"timestamp": es_factory.get_timestamp_millis(),`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`}`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`def _copy_and_update(self, src_obj, new_data):`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`obj = src_obj.copy()`
			`obj.update(new_data)`
			`return obj`

			`def test_task_logs(self):`
			`events = []`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`task = self._temp_task()`
			`for iter_ in range(10):`
			`log_event = self._create_task_event("log", task, iteration=iter_)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`events.append(`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`self._copy_and_update(`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`log_event,`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`{"msg": "This is a log message from test task iter " + str(iter_)},`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`)`
			`)`
			`# sleep so timestamp is not the same`
			`time.sleep(0.01)`
			`self.send_batch(events)`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`data = self.api.events.get_task_log(task=task)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`assert len(data["events"]) == 10`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`self.api.tasks.reset(task=task)`
			`data = self.api.events.get_task_log(task=task)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`assert len(data["events"]) == 0`

			`def test_task_metric_value_intervals_keys(self):`
			`metric = "Metric1"`
			`variant = "Variant1"`
			`iter_count = 100`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`task = self._temp_task()`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`events = [`
			`{`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`**self._create_task_event("training_stats_scalar", task, iteration),`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`"metric": metric,`
			`"variant": variant,`
			`"value": iteration,`
			`}`
			`for iteration in range(iter_count)`
			`]`
			`self.send_batch(events)`
			`for key in None, "iter", "timestamp", "iso_time":`
			`with self.subTest(key=key):`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`data = self.api.events.scalar_metrics_iter_histogram(task=task, key=key)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`self.assertIn(metric, data)`
			`self.assertIn(variant, data[metric])`
			`self.assertIn("x", data[metric][variant])`
			`self.assertIn("y", data[metric][variant])`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`def test_multitask_events_many_metrics(self):`
			`tasks = [`
			`self._temp_task(name="test events1"),`
			`self._temp_task(name="test events2"),`
			`]`
			`iter_count = 10`
			`metrics_count = 10`
			`variants_count = 10`
			`events = [`
			`{`
			`**self._create_task_event("training_stats_scalar", task, iteration),`
			`"metric": f"Metric{metric_idx}",`
			`"variant": f"Variant{variant_idx}",`
			`"value": iteration,`
			`}`
			`for iteration in range(iter_count)`
			`for task in tasks`
			`for metric_idx in range(metrics_count)`
			`for variant_idx in range(variants_count)`
			`]`
			`self.send_batch(events)`
			`data = self.api.events.multi_task_scalar_metrics_iter_histogram(tasks=tasks)`
			`self._assert_metrics_and_variants(`
			`data.metrics,`
			`metrics=metrics_count,`
			`variants=variants_count,`
			`tasks=tasks,`
			`iterations=iter_count,`
			`)`

			`def _assert_metrics_and_variants(`
			`self, data: dict, metrics: int, variants: int, tasks: Sequence, iterations: int`
			`):`
			`self.assertEqual(len(data), metrics)`
			`for m in range(metrics):`
			`metric_data = data[f"Metric{m}"]`
			`self.assertEqual(len(metric_data), variants)`
			`for v in range(variants):`
			`variant_data = metric_data[f"Variant{v}"]`
			`self.assertEqual(len(variant_data), len(tasks))`
			`for t in tasks:`
			`task_data = variant_data[t]`
			`self.assertEqual(len(task_data["x"]), iterations)`
			`self.assertEqual(len(task_data["y"]), iterations)`

Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`def test_task_metric_value_intervals(self):`
			`metric = "Metric1"`
			`variant = "Variant1"`
			`iter_count = 100`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`task = self._temp_task()`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`events = [`
			`{`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`**self._create_task_event("training_stats_scalar", task, iteration),`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`"metric": metric,`
			`"variant": variant,`
			`"value": iteration,`
			`}`
			`for iteration in range(iter_count)`
			`]`
			`self.send_batch(events)`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`data = self.api.events.scalar_metrics_iter_histogram(task=task)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`self._assert_metrics_histogram(data[metric][variant], iter_count, 100)`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`data = self.api.events.scalar_metrics_iter_histogram(task=task, samples=100)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`self._assert_metrics_histogram(data[metric][variant], iter_count, 100)`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`data = self.api.events.scalar_metrics_iter_histogram(task=task, samples=10)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`self._assert_metrics_histogram(data[metric][variant], iter_count, 10)`

			`def _assert_metrics_histogram(self, data, iters, samples):`
			`interval = iters // samples`
			`self.assertEqual(len(data["x"]), samples)`
			`self.assertEqual(len(data["y"]), samples)`
			`for curr in range(samples):`
			`self.assertEqual(data["x"][curr], curr * interval)`
			`self.assertEqual(`
			`data["y"][curr],`
			`mean(v for v in range(curr * interval, (curr + 1) * interval)),`
			`)`

			`def test_task_plots(self):`
Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`task = self._temp_task()`
			`event = self._create_task_event("plot", task, 0)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`event["metric"] = "roc"`
			`event.update(`
			`{`
			`"plot_str": json.dumps(`
			`{`
			`"data": [`
			`{`
			`"x": [0, 1, 2, 3, 4, 5, 6, 7, 8],`
			`"y": [0, 1, 2, 3, 4, 5, 6, 7, 8],`
			`"text": [`
			`"Th=0.1",`
			`"Th=0.2",`
			`"Th=0.3",`
			`"Th=0.4",`
			`"Th=0.5",`
			`"Th=0.6",`
			`"Th=0.7",`
			`"Th=0.8",`
			`],`
			`"name": "class1",`
			`},`
			`{`
			`"x": [0, 1, 2, 3, 4, 5, 6, 7, 8],`
			`"y": [2.0, 3.0, 5.0, 8.2, 6.4, 7.5, 9.2, 8.1, 10.0],`
			`"text": [`
			`"Th=0.1",`
			`"Th=0.2",`
			`"Th=0.3",`
			`"Th=0.4",`
			`"Th=0.5",`
			`"Th=0.6",`
			`"Th=0.7",`
			`"Th=0.8",`
			`],`
			`"name": "class2",`
			`},`
			`],`
			`"layout": {`
			`"title": "ROC for iter 0",`
			`"xaxis": {"title": "my x axis"},`
			`"yaxis": {"title": "my y axis"},`
			`},`
			`}`
			`)`
			`}`
			`)`
			`self.send(event)`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`event = self._create_task_event("plot", task, 100)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`event["metric"] = "confusion"`
			`event.update(`
			`{`
			`"plot_str": json.dumps(`
			`{`
			`"data": [`
			`{`
			`"y": [`
			`"lying",`
			`"sitting",`
			`"standing",`
			`"people",`
			`"backgroun",`
			`],`
			`"x": [`
			`"lying",`
			`"sitting",`
			`"standing",`
			`"people",`
			`"backgroun",`
			`],`
			`"z": [`
			`[758, 163, 0, 0, 23],`
			`[63, 858, 3, 0, 0],`
			`[0, 50, 188, 21, 35],`
			`[0, 22, 8, 40, 4],`
			`[12, 91, 26, 29, 368],`
			`],`
			`"type": "heatmap",`
			`}`
			`],`
			`"layout": {`
			`"title": "Confusion Matrix for iter 100",`
			`"xaxis": {"title": "Predicted value"},`
			`"yaxis": {"title": "Real value"},`
			`},`
			`}`
			`)`
			`}`
			`)`
			`self.send(event)`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`data = self.api.events.get_task_plots(task=task)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`assert len(data["plots"]) == 2`

Fix task scalars comparison aggregation 2020-02-04 16:16:27 +00:00			`self.api.tasks.reset(task=task)`
			`data = self.api.events.get_task_plots(task=task)`
Add Artifacts support, changed tags to system_tags and added user tags Add hyper parameter sorting Add min/max value for all time series metrics 2019-09-24 18:34:35 +00:00			`assert len(data["plots"]) == 0`

			`def send_batch(self, events):`
			`self.api.send_batch("events.add_batch", events)`

			`def send(self, event):`
			`self.api.send("events.add", event)`


			`if __name__ == "__main__":`
			`unittest.main()`