LocalScore - Test #2317 Results

TEST #2317 RESULTS

01/16/2026 - 10:12 PM

ACCELERATOR

NVIDIA GeForce RTX 3090

GPU

MODEL

Meta Llama 3.1 8B Instruct

Q4_K - Medium

8.0Bparams

110

tokens/s

generation

332

time to first token

3895

tokens/s

prompt

1088

LocalScore

HOW YOU STACK UP

Explore All Results

Meta Llama 3.1 8B Instruct - Q4_K - Medium

SYSTEM

CPU

Intel Core i5-14400 (alderlake)

RAM

125.6GB

Linux

Kernel Release

6.14.0-37-generic

Architecture

x86_64

Version

Cosmopolitan 3.9.7 MODE=x86_64; #37~24.04.1-Ubuntu SMP PREEMPT_DYNAMIC Thu Nov 20 10:25:38 UTC 2

RUNTIME

Name

llamafile

Version

0.9.2

Commit Hash

a30b324

DETAILED RESULTS

TEST NAME

PROMPT

GENERATION

TTFT

pp1024+tg16

4683

tokens/s

112

tokens/s

228

pp4096+tg256

3753

tokens/s

99.3

tokens/s

1.10

sec

pp2048+tg256

4017

tokens/s

109

tokens/s

519

pp2048+tg768

4327

tokens/s

107

tokens/s

483

pp1024+tg1024

4681

tokens/s

111

tokens/s

228

pp1280+tg3072

4538

tokens/s

105

tokens/s

291

pp384+tg1152

4861

tokens/s

113

tokens/s

pp64+tg1024

3351

tokens/s

117

tokens/s

pp16+tg1536

848

tokens/s

115

tokens/s