GPU benchmarks for local LLMs

Real Ollama inference results across 23 GPUs and 16 models. Updated Mar 13, 2026.

Model

Target speed 20 tok/s

Max budget $1,500

Loading benchmark data...

Benchmarks

Showing cards for -.

Show full matrix

Loading...

Loading...