Support iterating over all task metrics in task debug images

2025-06-26 23:15:47 +00:00 · 2021-05-03 17:43:02 +03:00 · 2021-05-03 17:43:02 +03:00 · 0d5174c453
commit 0d5174c453
parent c034c1a986
6 changed files with 150 additions and 66 deletions
--- a/apiserver/apimodels/events.py
+++ b/apiserver/apimodels/events.py
@ -38,7 +38,7 @@ class MultiTaskScalarMetricsIterHistogramRequest(HistogramRequestBase):
 class TaskMetric(Base):
    task: str = StringField(required=True)
-    metric: str = StringField(required=True)
+    metric: str = StringField(default=None)
 class DebugImagesRequest(Base):
--- a/apiserver/bll/event/debug_images_iterator.py
+++ b/apiserver/bll/event/debug_images_iterator.py
@ -3,17 +3,16 @@ from concurrent.futures.thread import ThreadPoolExecutor
 from functools import partial
 from itertools import chain
 from operator import attrgetter, itemgetter
-from typing import Sequence, Tuple, Optional, Mapping
+from typing import Sequence, Tuple, Optional, Mapping, Set
 import attr
 import dpath
-from boltons.iterutils import bucketize
+from boltons.iterutils import bucketize, first
 from elasticsearch import Elasticsearch
 from jsonmodels.fields import StringField, ListField, IntField
 from jsonmodels.models import Base
 from redis import StrictRedis
 from apiserver.apierrors import errors
 from apiserver.apimodels import JsonSerializableMixin
 from apiserver.bll.event.event_common import (
    EventSettings,
@ -73,7 +72,7 @@ class DebugImagesIterator:
    def get_task_events(
        self,
        company_id: str,
-        metrics: Sequence[Tuple[str, str]],
+        task_metrics: Mapping[str, Set[str]],
        iter_count: int,
        navigate_earlier: bool = True,
        refresh: bool = False,
@ -83,8 +82,7 @@ class DebugImagesIterator:
            return DebugImagesResult()
        def init_state(state_: DebugImageEventsScrollState):
-            unique_metrics = set(metrics)
+            state_.metrics = self._init_metric_states(company_id, task_metrics)
            state_.metrics = self._init_metric_states(company_id, list(unique_metrics))
        def validate_state(state_: DebugImageEventsScrollState):
            """
@ -92,14 +90,8 @@ class DebugImagesIterator:
            as requested in the current call.
            Refresh the state if requested
            """
            state_metrics = set((m.task, m.name) for m in state_.metrics)
            if state_metrics != set(metrics):
                raise errors.bad_request.InvalidScrollId(
                    "Task metrics stored in the state do not match the passed ones",
                    scroll_id=state_.id,
                )
            if refresh:
-                self._reinit_outdated_metric_states(company_id, state_)
+                self._reinit_outdated_metric_states(company_id, state_, task_metrics)
                for metric_state in state_.metrics:
                    metric_state.reset()
@ -123,14 +115,16 @@ class DebugImagesIterator:
            return res
    def _reinit_outdated_metric_states(
-        self, company_id, state: DebugImageEventsScrollState
+        self,
        company_id,
        state: DebugImageEventsScrollState,
        task_metrics: Mapping[str, Set[str]],
    ):
        """
        Determines the metrics for which new debug image events were added
        since their states were initialized and reinits these states
        """
-        task_ids = set(metric.task for metric in state.metrics)
+        tasks = Task.objects(id__in=list(task_metrics), company=company_id).only(
        tasks = Task.objects(id__in=list(task_ids), company=company_id).only(
            "id", "metric_stats"
        )
@ -140,6 +134,7 @@ class DebugImagesIterator:
            if not metric_stats:
                return []
            requested_metrics = task_metrics[task.id]
            return [
                (
                    (task.id, stats.metric),
@ -147,6 +142,7 @@ class DebugImagesIterator:
                )
                for stats in metric_stats.values()
                if self.EVENT_TYPE.value in stats.event_stats_by_type
                and (not requested_metrics or stats.metric in requested_metrics)
            ]
        update_times = dict(
@ -154,32 +150,31 @@ class DebugImagesIterator:
                get_last_update_times_for_task_metrics(task) for task in tasks
            )
        )
-        outdated_metrics = [
+
        metrics_to_update = defaultdict(set)
        for (task, metric), update_time in update_times.items():
            state_metric = first(
                m for m in state.metrics if m.task == task and m.name == metric
            )
            if not state_metric or state_metric.timestamp < update_time:
                metrics_to_update[task].add(metric)
        if metrics_to_update:
            state.metrics = [
                *(
                    metric
                    for metric in state.metrics
-            if (metric.task, metric.name) in update_times
+                    if metric.name not in metrics_to_update.get(metric.task, [])
            and update_times[metric.task, metric.name] > metric.timestamp
        ]
        state.metrics = [
            *(metric for metric in state.metrics if metric not in outdated_metrics),
            *(
                self._init_metric_states(
                    company_id,
                    [(metric.task, metric.name) for metric in outdated_metrics],
                )
                ),
                *(self._init_metric_states(company_id, metrics_to_update)),
            ]
    def _init_metric_states(
-        self, company_id: str, metrics: Sequence[Tuple[str, str]]
+        self, company_id: str, task_metrics: Mapping[str, Set[str]]
    ) -> Sequence[MetricScrollState]:
        """
        Returned initialized metric scroll stated for the requested task metrics
        """
        tasks = defaultdict(list)
        for (task, metric) in metrics:
            tasks[task].append(metric)
        with ThreadPoolExecutor(EventSettings.max_workers) as pool:
            return list(
                chain.from_iterable(
@ -187,30 +182,25 @@ class DebugImagesIterator:
                        partial(
                            self._init_metric_states_for_task, company_id=company_id
                        ),
-                        tasks.items(),
+                        task_metrics.items(),
                    )
                )
            )
    def _init_metric_states_for_task(
-        self, task_metrics: Tuple[str, Sequence[str]], company_id: str
+        self, task_metrics: Tuple[str, Set[str]], company_id: str
    ) -> Sequence[MetricScrollState]:
        """
        Return metric scroll states for the task filled with the variant states
        for the variants that reported any debug images
        """
        task, metrics = task_metrics
        must = [{"term": {"task": task}}, {"exists": {"field": "url"}}]
        if metrics:
            must.append({"terms": {"metric": list(metrics)}})
        es_req: dict = {
            "size": 0,
-            "query": {
+            "query": {"bool": {"must": must}},
                "bool": {
                    "must": [
                        {"term": {"task": task}},
                        {"terms": {"metric": metrics}},
                        {"exists": {"field": "url"}},
                    ]
                }
            },
            "aggs": {
                "metrics": {
                    "terms": {
@ -254,10 +244,7 @@ class DebugImagesIterator:
        with translate_errors_context(), TimingContext("es", "_init_metric_states"):
            es_res = search_company_events(
-                self.es,
+                self.es, company_id=company_id, event_type=self.EVENT_TYPE, body=es_req,
                company_id=company_id,
                event_type=self.EVENT_TYPE,
                body=es_req,
            )
        if "aggregations" not in es_res:
            return []
@ -397,10 +384,7 @@ class DebugImagesIterator:
        }
        with translate_errors_context(), TimingContext("es", "get_debug_image_events"):
            es_res = search_company_events(
-                self.es,
+                self.es, company_id=company_id, event_type=self.EVENT_TYPE, body=es_req,
                company_id=company_id,
                event_type=self.EVENT_TYPE,
                body=es_req,
            )
        if "aggregations" not in es_res:
            return metric.task, metric.name, []
--- a/apiserver/bll/task/task_cleanup.py
+++ b/apiserver/bll/task/task_cleanup.py
@ -110,12 +110,15 @@ def collect_debug_image_urls(company: str, task: str) -> Set[str]:
    if not metrics:
        return set()
-    task_metrics = [(task, metric) for metric in metrics]
+    task_metrics = {task: set(metrics)}
    scroll_id = None
    urls = defaultdict(set)
    while True:
        res = event_bll.debug_images_iterator.get_task_events(
-            company_id=company, metrics=task_metrics, iter_count=100, state_id=scroll_id
+            company_id=company,
            task_metrics=task_metrics,
            iter_count=100,
            state_id=scroll_id,
        )
        if not res.metric_events or not any(
            events for _, _, events in res.metric_events
--- a/apiserver/schema/services/events.conf
+++ b/apiserver/schema/services/events.conf
@ -187,14 +187,14 @@
        }
        task_metric {
            type: object
-            required: [task, metric]
+            required: [task]
            properties {
                task {
                    description: "Task ID"
                    type: string
                }
                metric {
-                    description: "Metric name"
+                    description: "Metric name. If not specified then all metrics for this task will be returned"
                    type: string
                }
            }
--- a/apiserver/services/events.py
+++ b/apiserver/services/events.py
@ -594,10 +594,16 @@ def get_debug_images_v1_8(call, company_id, _):
    response_data_model=DebugImageResponse,
 )
 def get_debug_images(call, company_id, request: DebugImagesRequest):
-    task_ids = {m.task for m in request.metrics}
+    task_metrics = defaultdict(set)
    for tm in request.metrics:
        task_metrics[tm.task].add(tm.metric)
    for metrics in task_metrics.values():
        if None in metrics:
            metrics.clear()
    tasks = task_bll.assert_exists(
        company_id,
-        task_ids=task_ids,
+        task_ids=list(task_metrics),
        allow_public=True,
        only=("company", "company_origin"),
    )
@ -610,7 +616,7 @@ def get_debug_images(call, company_id, request: DebugImagesRequest):
    result = event_bll.debug_images_iterator.get_task_events(
        company_id=next(iter(companies)),
-        metrics=[(m.task, m.metric) for m in request.metrics],
+        task_metrics=task_metrics,
        iter_count=request.iters,
        navigate_earlier=request.navigate_earlier,
        refresh=request.refresh,
--- a/apiserver/tests/automated/test_task_debug_images.py
+++ b/apiserver/tests/automated/test_task_debug_images.py
@ -1,6 +1,5 @@
 from functools import partial
-from typing import Sequence
+from typing import Sequence, Mapping
 from apiserver.es_factory import es_factory
 from apiserver.tests.automated import TestService
@ -128,6 +127,98 @@ class TestTaskDebugImages(TestService):
    def test_task_debug_images(self):
        task = self._temp_task()
        # test empty
        res = self.api.events.debug_images(metrics=[{"task": task}], iters=5)
        self.assertFalse(res.metrics)
        res = self.api.events.debug_images(
            metrics=[{"task": task}], iters=5, scroll_id=res.scroll_id, refresh=True
        )
        self.assertFalse(res.metrics)
        # test not empty
        metrics = {
            "Metric1": ["Variant1", "Variant2"],
            "Metric2": ["Variant3", "Variant4"],
        }
        events = [
            self._create_task_event(
                task=task,
                iteration=1,
                metric=metric,
                variant=variant,
                url=f"{metric}_{variant}_{1}",
            )
            for metric, variants in metrics.items()
            for variant in variants
        ]
        self.send_batch(events)
        scroll_id = self._assertTaskMetrics(
            task=task, expected_metrics=metrics, iterations=1
        )
        # test refresh
        update = {
            "Metric2": ["Variant3", "Variant4", "Variant5"],
            "Metric3": ["VariantA", "VariantB"],
        }
        events = [
            self._create_task_event(
                task=task,
                iteration=2,
                metric=metric,
                variant=variant,
                url=f"{metric}_{variant}_{2}",
            )
            for metric, variants in update.items()
            for variant in variants
        ]
        self.send_batch(events)
        # without refresh the metric states are not updated
        scroll_id = self._assertTaskMetrics(
            task=task, expected_metrics=metrics, iterations=0, scroll_id=scroll_id
        )
        # with refresh there are new metrics and existing ones are updated
        metrics.update(update)
        self._assertTaskMetrics(
            task=task,
            expected_metrics=metrics,
            iterations=1,
            scroll_id=scroll_id,
            refresh=True,
        )
        pass
    def _assertTaskMetrics(
        self,
        task: str,
        expected_metrics: Mapping[str, Sequence[str]],
        iterations,
        scroll_id: str = None,
        refresh=False,
    ) -> str:
        res = self.api.events.debug_images(
            metrics=[{"task": task}], iters=1, scroll_id=scroll_id, refresh=refresh
        )
        self.assertEqual(set(m.metric for m in res.metrics), set(expected_metrics))
        if not iterations:
            self.assertTrue(all(m.iterations == [] for m in res.metrics))
            return res.scroll_id
        for metric_data in res.metrics:
            expected_variants = set(expected_metrics[metric_data.metric])
            self.assertEqual(len(metric_data.iterations), iterations)
            for it_data in metric_data.iterations:
                self.assertEqual(
                    set(e.variant for e in it_data.events), expected_variants
                )
        return res.scroll_id
    def test_get_debug_images_navigation(self):
        task = self._temp_task()
        metric = "Metric1"
        variants = [("Variant1", 7), ("Variant2", 4)]
        iterations = 10
@ -195,7 +286,7 @@ class TestTaskDebugImages(TestService):
        expected_page: int,
        iters: int = 5,
        **extra_params,
-    ):
+    ) -> str:
        res = self.api.events.debug_images(
            metrics=[{"task": task, "metric": metric}],
            iters=iters,