CLI observability reference¶

How events.jsonl run logs, the exchange log, and CLI flags relate to manifests, overlays, and observability settings.

Applies to mas-ctl chat, mas-ctl tui, mas-ctl run-mas, and (for benchmarks) mas-lab benchmark run.

Term definitions: glossary.md.

Three outputs (do not confuse them)¶

Output	What it is	Primary consumer
`events.jsonl`	Machine-readable run log — one JSON object per line	Pipeline steps (`extract_trace_stats`, `eval_mce`), `mas-lab telemetry`, plots
Exchange log	Human-readable AGENT↔LLM↔TOOL transcript on stderr	Interactive debugging (`mas-ctl chat --trace`)
OTel spans	OpenTelemetry export (optional second sink)	External collectors (`--events-format otel`)

Structural claims in experiments (governance fired, tool counts, HITL gates) must be checked from events.jsonl, not from the exchange log.

Enable `events.jsonl`¶

1. Manifest (persistent)¶

Add observability to the agent or MAS manifest:

spec:
  observability:
    enabled: true
    format: native          # native | boundary | both | otel
    events_file: traces/events.jsonl

2. Overlay (recommended for experiments)¶

An overlay is a patch file merged onto the manifest. Use the standard observability overlay:

mas-ctl chat agent.yaml -o docs/schemas/examples/overlays/observability-native.yaml
mas-ctl run-mas mas.yaml -o docs/schemas/examples/overlays/observability-native.yaml

Example overlay: schemas/examples/overlays/observability-native.yaml

3. CLI flags (session override)¶

On mas-ctl chat, mas-ctl tui, and mas-ctl run-mas — override the manifest for one session:

Flag	Effect
`--events` / `--no-events`	Force observability on or off
`--events-file PATH`	JSONL path (default `traces/events.jsonl` under run cwd)
`--events-stdout`	Also stream JSONL records on stderr
`--events-format FORMAT`	`native`, `boundary`, `both`, or `otel`

Shortcut: --events is equivalent to the observability-native overlay for one run. For benchmarks, prefer overlay or manifest so every scenario sees the same settings.

mas-ctl chat agent.yaml -i \
  --events \
  --events-file logs/events.jsonl \
  --events-format native

Equivalence table¶

Goal	Manifest	Overlay	CLI
Native `events.jsonl`	`spec.observability.enabled: true`	`observability-native.yaml`	`--events`
Custom path	`events_file:`	patch `events_file`	`--events-file PATH`
Stream JSONL to terminal	—	—	`--events-stdout`
Boundary + native	`format: both`	—	`--events-format both`
OTel spans in file	`format: otel`	—	`--events-format otel`

Exchange log (interactive trace)¶

Separate from events.jsonl: a pretty-printed transcript on mas-ctl chat only (not written to benchmark artifacts).

Flag	Effect
`--trace`	Stream AGENT↔LLM↔TOOL exchanges on stderr
`--trace-timestamps`	Add UTC timestamp and elapsed time
`--trace-engine`	Include raw engine I/O JSON

mas-ctl chat agent.yaml -i --trace
mas-ctl chat agent.yaml -i --trace --trace-timestamps

`events.jsonl` record shape¶

Common kind values (native transform):

Kind	Meaning
`execution_start`, `execution_end`	Run lifecycle
`llm_call_start`, `llm_call_end`	Model call (latency on `_end`)
`tool_call_start`, `tool_call_end`	Tool call
`governance_event`, `governance_policy`	Policy / budget hooks
`routing`, `routing_result`	Delegation between agents in a MAS

After a benchmark, logs are stored at:

<output_dir>/<scenario>/item<N>/r<N>/traces/events.jsonl

With trace cache enabled, the path may be a link to a shared copy; pipeline steps resolve it automatically.

`mas-lab telemetry` (post-run)¶

mas-lab telemetry show  path/to/traces/events.jsonl
mas-lab telemetry dump  path/to/traces/events.jsonl
mas-lab telemetry push  path/to/traces/events.jsonl --endpoint http://localhost:4318

Benchmarks and observability¶

mas-lab benchmark run experiment.yaml does not take --events. Observability is configured through:

Flavour (experiment.yaml → instrumentation preset)
Overlays on scenarios or the app
App defaults in the bundled MAS

The embedded pipeline in experiment.yaml runs after execution:

mas-lab benchmark run labs/lifecycle-control.lab/experiment.yaml --progress

See Tutorial 3 for pipeline and figure workflows.

ctl/tui.md — same --events* flags
Web UI — browse run artifacts
glossary.md — manifest terms