Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

150

Full-text search

Active filters: nvfp4

GadflyII/GLM-4.7-Flash-NVFP4

Text Generation • 18B • Updated 16 days ago • 261k • 58

GadflyII/Qwen3-Coder-Next-NVFP4

Text Generation • Updated 1 day ago • 1.56k • 8

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 23 days ago • 15k • 21

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated 23 days ago • 30.8k • 28

llmat/Qwen3-30B-A3B-Instruct-2507-NVFP4

Text Generation • 17B • Updated Aug 27, 2025 • 176 • 2

nvidia/DeepSeek-V3.2-NVFP4

Text Generation • 394B • Updated 15 days ago • 4.03k • 4

nvidia/Qwen3-235B-A22B-Thinking-2507-NVFP4

Text Generation • 120B • Updated 5 days ago • 106 • 1

nvidia/Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation • 120B • Updated 5 days ago • 240 • 1

GadflyII/MiniMax-M2.1-NVFP4

Text Generation • Updated 10 days ago • 4.1k • 5

GadflyII/GLM-4.6V-NVFP4

Image-Text-to-Text • 62B • Updated 24 days ago • 5.49k • 3

Firworks/SERA-32B-nvfp4

19B • Updated 4 days ago • 45 • 1

vincentzed-hf/Qwen3-Coder-Next-NVFP4

Text Generation • Updated 1 day ago • 184 • 1

apolloparty/Qwen3-4B-NVFP4A16

2B • Updated Jul 12, 2025 • 1

cortecs/Qwen3-8B-NVFP4A16

5B • Updated Nov 27, 2025 • 2

cortecs/Qwen3-8B-NVFP4

5B • Updated Nov 27, 2025 • 10

cortecs/Qwen3-8B-clean-sparse

6B • Updated Nov 27, 2025 • 1

cortecs/Qwen3-8B-clean-sparse-nvfp4a16

5B • Updated Nov 27, 2025

cortecs/Qwen3-8B-clean-sparse-finetuned-0.01-nvfp4a16

5B • Updated Nov 27, 2025 • 1

cortecs/Qwen3-8B-clean-sparse-finetuned-0.1-nvfp4a16

5B • Updated Nov 27, 2025 • 2

llmat/Mistral-Small-24B-Instruct-2501-NVFP4

Text Generation • 14B • Updated Aug 27, 2025 • 58

llmat/Qwen3-4B-Instruct-2507-NVFP4

Text Generation • 3B • Updated Aug 27, 2025 • 56 • 1

llmat/Qwen3-30B-A3B-NVFP4

Text Generation • 17B • Updated Aug 28, 2025 • 3

llmat/Qwen3-32B-NVFP4

Text Generation • 19B • Updated Aug 28, 2025 • 6

llmat/Qwen3-14B-NVFP4

Text Generation • 9B • Updated Aug 28, 2025 • 18

llmat/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Aug 28, 2025 • 3

llmat/Qwen3-4B-NVFP4

Text Generation • 3B • Updated Aug 28, 2025 • 27

llmat/Qwen3-1.7B-NVFP4

Text Generation • 1B • Updated Aug 28, 2025 • 1

llmat/Qwen3-0.6B-NVFP4

Text Generation • 0.6B • Updated Aug 28, 2025 • 4

2imi9/gpt-oss-20B-NVFP4A16-BF16

Text Generation • 21B • Updated Dec 19, 2025 • 3.72k • 3

llmat/Apertus-8B-Instruct-2509-NVFP4

Text Generation • 5B • Updated Sep 3, 2025 • 2 • 1