Experiments

Experiment comparison matrix

Compare exported retrieval configs against real qrels-backed evaluation runs from the full local pipeline.

Snapshot source /demo-data/experiments.json

Public experiment snapshot

Best-by-metric indicators use real exported evaluation metrics. Admin comparison jobs are disabled publicly.

0 configs and 0 latest completed runs loaded.

Computed from latest completed runs.

Not enough comparable data.

Computed from latest completed runs.

Not enough comparable data.

Computed from latest completed runs.

Not enough comparable data.

Computed from latest completed runs.

Not enough comparable data.

Latest completed runs with real Recall@10, MRR@10, and NDCG@10 values.

No real quality metrics are available for charting.

Latest completed runs with real measured latency fields.

No real latency values are available for charting.

Latest completed evaluation run per experiment config. Missing values stay unavailable.

No experiment configs are available for comparison.

Reusable retrieval parameter sets returned by FastAPI.

No experiment configs returned by FastAPI.

No config is selected.

Config details are shown only for real configs returned by FastAPI.

Admin comparison jobs are intentionally disabled in public snapshot mode.

The experiment rows and metrics are real exported outputs. Run the full local stack to seed configs or launch new comparison jobs.