LocalScore - Test #175 Results

Home Latest Results Download About Blog

TEST #175 RESULTS

03/30/2025 - 8:15 PM

ACCELERATOR

NVIDIA GeForce RTX 5090

GPU

31

GB

MODEL

Qwen2.5 14B Instruct

Q4_K - Medium

14.8Bparams

65.1

tokens/s

generation

279

ms

time to first token

4787

tokens/s

prompt

1037

LocalScore

HOW YOU STACK UP

Explore All Results

Qwen2.5 14B Instruct - Q4_K - Medium

SYSTEM

CPU

AMD Ryzen 9 3900X 12-Core Processor (znver2)

RAM

125.7GB

OS

Linux

Kernel Release

6.8.0-52-generic

Architecture

x86_64

Version

Cosmopolitan 3.9.7 MODE=x86_64; #53~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Wed Jan 15 19:18:46 UTC 2

RUNTIME

Name

llamafile

Version

0.9.2

Commit Hash

a30b324

DETAILED RESULTS

TEST NAME

PROMPT

GENERATION

TTFT

pp1024+tg16

6233

tokens/s

73.2

tokens/s

178

ms

pp4096+tg256

4437

tokens/s

46.1

tokens/s

945

ms

pp2048+tg256

5497

tokens/s

61.1

tokens/s

389

ms

pp2048+tg768

5483

tokens/s

57.8

tokens/s

390

ms

pp1024+tg1024

6236

tokens/s

66.5

tokens/s

178

ms

pp1280+tg3072

5838

tokens/s

54.7

tokens/s

234

ms

pp384+tg1152

6322

tokens/s

72.9

tokens/s

73

ms

pp64+tg1024

2844

tokens/s

78.4

tokens/s

34

ms

pp16+tg1536

192

tokens/s

75.3

tokens/s

95

ms