Edit Models filters

Inference Providers

HF Inference API

Misc

arxiv: 2009.03300

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

1,168

Full-text search

Active filters: 2009.03300

google/gemma-3-4b-it-qat-q4_0-gguf

Image-Text-to-Text • 4B • Updated Apr 11 • 4.47k • 193

google/gemma-3-27b-it-qat-q4_0-gguf

Image-Text-to-Text • 27B • Updated Apr 11 • 6.68k • 331

google/t5gemma-b-b-prefixlm

Text Generation • 0.6B • Updated Jul 9 • 16.1M • 5

litert-community/gemma-3-270m-it

Text Generation • Updated 12 days ago • 19

Qwen/Qwen-14B-Chat

Text Generation • 14B • Updated Dec 13, 2023 • 2.66k • 366

dmis-lab/meerkat-7b-v1.0

Text Generation • 7B • Updated May 7 • 417 • 25

google/gemma-2-9b-it

Text Generation • 9B • Updated Aug 27, 2024 • 114k • • 734

nvidia/Minitron-8B-Base

Text Generation • Updated Feb 14 • 17.2k • 69

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • 8B • Updated Aug 22, 2024 • 3.9k • 177

nvidia/Llama-3_1-Nemotron-51B-Instruct

Text Generation • 52B • Updated Jul 6 • 10.2k • 210

mistralai/Mistral-Small-24B-Base-2501

24B • Updated Jul 28 • 22.7k • 257

google/gemma-3-12b-pt

Image-Text-to-Text • 12B • Updated Mar 21 • 65.5k • 69

google/gemma-3-1b-it-qat-q4_0-gguf

Text Generation • 1.0B • Updated Apr 11 • 2.46k • 80

unsloth/gemma-3-1b-it-unsloth-bnb-4bit

Text Generation • 0.7B • Updated May 12 • 140k • 4

gaunernst/gemma-3-12b-it-int4-awq

Image-Text-to-Text • 3B • Updated Apr 6 • 3.77k • 17

allenai/DataDecide-dolma1_7-no-flan-90M

0.1B • Updated Apr 9 • 469 • 1

google/gemma-3-1b-it-qat-q4_0-unquantized

Text Generation • 1.0B • Updated Apr 15 • 2.35k • 9

google/gemma-3-1b-it-qat-int4-unquantized

Text Generation • 1.0B • Updated Apr 15 • 2.65k • 11

unsloth/gemma-3-12b-it-qat-GGUF

Image-Text-to-Text • 12B • Updated May 12 • 36.4k • 28

unsloth/gemma-3-27b-it-qat

Image-Text-to-Text • 27B • Updated May 12 • 1.3k • • 4

unsloth/gemma-3-4b-it-qat-GGUF

Image-Text-to-Text • 4B • Updated Jun 15 • 9.49k • 19

unsloth/gemma-3-27b-it-qat-GGUF

Image-Text-to-Text • 27B • Updated May 9 • 8.13k • 16

google/gemma-3n-E4B

Image-Text-to-Text • 8B • Updated Jul 14 • 5.61k • 91

google/gemma-3n-E2B

Image-Text-to-Text • 5B • Updated Jul 14 • 3.71k • 62

google/t5gemma-l-l-ul2

Text Generation • 1B • Updated Jul 9 • 281 • 3

google/t5gemma-l-l-prefixlm

Text Generation • 1B • Updated Jul 9 • 220 • 3

unsloth/gemma-3n-E2B-it-GGUF

Image-Text-to-Text • 4B • Updated Jul 17 • 29.4k • 40

unsloth/gemma-3-270m-it-unsloth-bnb-4bit

Text Generation • 0.2B • Updated 20 days ago • 34.9k • 3

FastFlowLM/Gemma3-1B-NPU2

Text Generation • Updated 9 days ago • 26 • 1

QuantFactory/gemma-3-270m-it-GGUF

Text Generation • 0.4B • Updated 4 days ago • 392 • 1