metrics stored (2x)

2026-04-21 20:41:17 -06:00 · 2026-04-21 20:41:17 -06:00 · 3280410405
commit 3280410405
parent c6bd693058
2 changed files with 231 additions and 2 deletions
--- a/flows/embedding_flow.py
+++ b/flows/embedding_flow.py
@ -20,11 +20,13 @@ os.environ.setdefault("NUMEXPR_NUM_THREADS", "1")
 os.environ.setdefault("NUMBA_NUM_THREADS", "1")

 from datetime import timedelta
+import json
 import math
 from pathlib import Path
 from typing import Any, Dict, List, Optional

 from prefect import flow, task
+from prefect.artifacts import create_markdown_artifact, create_table_artifact
 from prefect.cache_policies import INPUTS, NO_CACHE
 from prefect_ray import RayTaskRunner

@ -113,6 +115,103 @@ def collect_data_task(
    )


+def _fmt(v: Any, spec: str = ".4f") -> str:
+    return format(v, spec) if isinstance(v, (int, float)) else "—"
+
+
+def _mean_of(series: List[Dict[str, Any]], key: str) -> Optional[float]:
+    vals = [r[key] for r in series if isinstance(r.get(key), (int, float))]
+    return float(sum(vals) / len(vals)) if vals else None
+
+
+@task(
+    task_run_name="metrics-{output_path}",
+    retries=1,
+    cache_policy=NO_CACHE,
+)
+def compute_metrics_task(
+    snapshot_list: List[pd.DataFrame],
+    embedded_dfs: List[pd.DataFrame],
+    embed_columns: List[str],
+    output_path: str,
+    meta: Dict[str, Any],
+    id_column: str = "id",
+    k: int = 10,
+) -> str:
+    metrics = E.compute_metrics(
+        snapshot_list=snapshot_list,
+        embedded_list=embedded_dfs,
+        embed_columns=embed_columns,
+        id_column=id_column,
+        k=k,
+    )
+    payload = {"meta": meta, **metrics}
+    Path(output_path).parent.mkdir(parents=True, exist_ok=True)
+    with open(output_path, "w") as f:
+        json.dump(payload, f, indent=2)
+
+    # --- Prefect artifacts ---
+    ff = metrics["travel"]["frame_to_frame"]
+    vi = metrics["travel"]["vs_initial"]
+    kn = metrics["knn_retention"]
+
+    ff_by_t = {r["t"]: r for r in ff}
+    vi_by_t = {r["t"]: r for r in vi}
+    kn_by_t = {r["t"]: r for r in kn}
+    all_t = sorted(set(ff_by_t) | set(vi_by_t) | set(kn_by_t))
+    rows = []
+    for t in all_t:
+        f_, v_, k_ = ff_by_t.get(t, {}), vi_by_t.get(t, {}), kn_by_t.get(t, {})
+        rows.append({
+            "t": t,
+            "ff_mean": f_.get("mean"), "ff_median": f_.get("median"),
+            "ff_p95": f_.get("p95"), "ff_max": f_.get("max"), "ff_n": f_.get("n_pairs"),
+            "vi_mean": v_.get("mean"), "vi_median": v_.get("median"),
+            "vi_p95": v_.get("p95"), "vi_max": v_.get("max"), "vi_n": v_.get("n_pairs"),
+            "knn_mean": k_.get("mean"), "knn_n": k_.get("n_points"),
+        })
+
+    gen_short = meta["generator_path"].split(".")[-1]
+    emb_short = meta["embedder"].split(".")[-1]
+    desc = (
+        f"`{emb_short}` on `{gen_short}` — "
+        f"N={meta['num_points']} T={meta['num_timesteps']} "
+        f"J={meta['jitter_scale']} s={meta['seed']}"
+    )
+
+    create_table_artifact(
+        key="embedding-metrics",
+        table=rows,
+        description=desc,
+    )
+
+    ff_last = ff[-1] if ff else {}
+    vi_last = vi[-1] if vi else {}
+    md = (
+        f"### {emb_short} on {gen_short}\n\n"
+        f"**N** {meta['num_points']} · **T** {meta['num_timesteps']} · "
+        f"**J** {meta['jitter_scale']} · **seed** {meta['seed']}\n\n"
+        f"| window | mean | median | p95 | max |\n"
+        f"|---|---|---|---|---|\n"
+        f"| frame-to-frame (avg over t) | {_fmt(_mean_of(ff, 'mean'))} | "
+        f"{_fmt(_mean_of(ff, 'median'))} | {_fmt(_mean_of(ff, 'p95'))} | "
+        f"{_fmt(_mean_of(ff, 'max'))} |\n"
+        f"| vs-initial (final t) | {_fmt(vi_last.get('mean'))} | "
+        f"{_fmt(vi_last.get('median'))} | {_fmt(vi_last.get('p95'))} | "
+        f"{_fmt(vi_last.get('max'))} |\n\n"
+        f"**kNN retention** (k={metrics['k']}): "
+        f"mean across timesteps = {_fmt(_mean_of(kn, 'mean'), '.3f')}\n\n"
+        f"_Sidecar JSON:_ `{output_path}`\n"
+    )
+    create_markdown_artifact(
+        key="embedding-metrics-summary",
+        markdown=md,
+        description=desc,
+    )
+
+    return output_path
+
+
@task(
    task_run_name="plot-{output_path}",
    retries=3,
@ -183,6 +282,7 @@ def embedding_flow(
    output_embed: str = (
        f"{output_dir.strip('/')}/{_generator}_{embedder.split('.')[-1]}_N{num_points}_T{num_timesteps}_J{jitter_scale}_s{seed}.html"
    )
+    output_metrics: str = output_embed[:-5] + ".metrics.json"
    title_ref = f"Reference: {_generator}, N={num_points} with {jitter_scale} noise"
    title_embed = f"Embedding: {embedder.split('.')[-1]} on {_generator}, N={num_points} with {jitter_scale} noise"

@ -258,7 +358,27 @@ def embedding_flow(
        samples=samples,
    )

-    return (ref_path.result(), emb_path.result())
+    # Sidecar stability metrics (travel + kNN retention). Runs in parallel
+    # with plotting; writes a JSON next to the embedding fig.
+    metrics_path = compute_metrics_task.submit(
+        snapshot_list=snapshot_list,
+        embedded_dfs=embeddings.result(),
+        embed_columns=embed_columns,
+        output_path=output_metrics,
+        meta={
+            "num_points": num_points,
+            "num_timesteps": num_timesteps,
+            "jitter_scale": jitter_scale,
+            "seed": seed,
+            "generator_path": generator_path,
+            "embedder": embedder,
+            "embed_args": merged_embed_args,
+        },
+        id_column=id_column,
+        k=10,
+    )
+
+    return (ref_path.result(), emb_path.result(), metrics_path.result())


 if __name__ == "__main__":
--- a/flows/embedding_utils.py
+++ b/flows/embedding_utils.py
@ -1,7 +1,7 @@
 # embedding_utils.py

 import importlib
-from typing import List, Optional, Type, Union
+from typing import Any, Dict, List, Optional, Type, Union

 import numpy as np
 import pandas as pd
@ -423,6 +423,115 @@ def generate_initial_frame(
    return df


+def _travel_stats(d: np.ndarray) -> Dict[str, Any]:
+    """Summary stats for a 1-D vector of displacements."""
+    if d.size == 0:
+        return {"mean": None, "median": None, "p95": None, "max": None, "n_pairs": 0}
+    return {
+        "mean": float(np.mean(d)),
+        "median": float(np.median(d)),
+        "p95": float(np.percentile(d, 95)),
+        "max": float(np.max(d)),
+        "n_pairs": int(d.size),
+    }
+
+
+def compute_metrics(
+    snapshot_list: List[pd.DataFrame],
+    embedded_list: List[pd.DataFrame],
+    embed_columns: List[str],
+    id_column: str = "id",
+    k: int = 10,
+) -> Dict[str, Any]:
+    """
+    Per-timestep stability metrics for a DR run.
+
+    - travel.frame_to_frame[t]: point displacement in 2-D output space
+      between timestep t-1 and t (inner-joined on id).
+    - travel.vs_initial[t]: displacement in 2-D output space between
+      timestep 0 and t (inner-joined on id).
+    - knn_retention[t]: mean per-point fraction of k nearest input-space
+      neighbours that remain neighbours in output space.
+
+    Input: snapshot_list and embedded_list have len == num_timesteps and
+    align index-wise. Each snapshot carries {embed_columns}+id+time; each
+    embedding carries id+x+y+time. ids may differ across timesteps (the
+    generator adds/removes points), so all joins are inner on id.
+    """
+    from sklearn.neighbors import NearestNeighbors
+
+    assert len(snapshot_list) == len(embedded_list), "snapshot/embedding count mismatch"
+    T = len(embedded_list)
+
+    emb_by_id = [
+        df.drop_duplicates(subset=[id_column]).set_index(id_column)[["x", "y"]]
+        for df in embedded_list
+    ]
+
+    # --- travel ---
+    frame_to_frame: List[Dict[str, Any]] = []
+    vs_initial: List[Dict[str, Any]] = []
+    initial = emb_by_id[0] if T > 0 else None
+
+    for t in range(1, T):
+        curr = emb_by_id[t]
+        prev = emb_by_id[t - 1]
+
+        common_ff = curr.index.intersection(prev.index)
+        d_ff = np.linalg.norm(
+            curr.loc[common_ff].to_numpy() - prev.loc[common_ff].to_numpy(), axis=1
+        ) if len(common_ff) else np.array([])
+        frame_to_frame.append({"t": t, **_travel_stats(d_ff)})
+
+        common_vi = curr.index.intersection(initial.index)
+        d_vi = np.linalg.norm(
+            curr.loc[common_vi].to_numpy() - initial.loc[common_vi].to_numpy(), axis=1
+        ) if len(common_vi) else np.array([])
+        vs_initial.append({"t": t, **_travel_stats(d_vi)})
+
+    # --- kNN retention ---
+    knn_retention: List[Dict[str, Any]] = []
+    for t in range(T):
+        snap = snapshot_list[t].drop_duplicates(subset=[id_column])
+        emb = embedded_list[t].drop_duplicates(subset=[id_column])
+        common = snap[id_column].values
+        common = np.intersect1d(common, emb[id_column].values)
+        n = len(common)
+        k_eff = min(k, n - 1) if n > 1 else 0
+        if k_eff <= 0:
+            knn_retention.append({"t": t, "k": k_eff, "mean": None, "n_points": int(n)})
+            continue
+
+        snap_idx = snap.set_index(id_column).loc[common]
+        emb_idx = emb.set_index(id_column).loc[common]
+        X_in = snap_idx[embed_columns].to_numpy()
+        X_out = emb_idx[["x", "y"]].to_numpy()
+
+        nn_in = NearestNeighbors(n_neighbors=k_eff + 1).fit(X_in)
+        nn_out = NearestNeighbors(n_neighbors=k_eff + 1).fit(X_out)
+        idx_in = nn_in.kneighbors(X_in, return_distance=False)[:, 1:]
+        idx_out = nn_out.kneighbors(X_out, return_distance=False)[:, 1:]
+
+        # per-row intersection count via broadcast equality
+        matches = (idx_out[:, :, None] == idx_in[:, None, :]).any(axis=2).sum(axis=1)
+        retentions = matches / k_eff
+        knn_retention.append({
+            "t": t,
+            "k": int(k_eff),
+            "mean": float(np.mean(retentions)),
+            "n_points": int(n),
+        })
+
+    return {
+        "k": int(k),
+        "travel": {
+            "frame_to_frame": frame_to_frame,
+            "vs_initial": vs_initial,
+        },
+        "knn_retention": knn_retention,
+    }
+
+
 def generate_jittered_snapshots(
    initial_df: pd.DataFrame,
    num_timesteps: int,