LevelbrookLabs

An engineering experiment

AI Agent Evaluation Dashboard

New Evaluation Run

Agent Model

Environment

Simulations

Evaluation History

Run ID	Agent	Environment	Timestamp	Status	Success Rate	Actions

No runs match the current filter.

Levelbrook Consulting · levelbrook.com · github.com/tachyurgy

Run Details