2026-05-14

Added

stephen-reid-coding-agents-benchmarks - Coding agent benchmarks framed as cost vs speed: once models are “good enough”, tasks/ $and time/task matter; Substack notes Cursor Composer 2 as a major outlier (~14 tasks/$ at ~521s).