All models
LLM Catalog — 185 models, every license & size.
Filter by hardware fit, license, or use case. Specs, VRAM at every quantization, install command, and benchmark scores for each model. Data shared under CC BY 4.0.
Alibaba · 33 models
397B · Apache 2.0
Qwen 3.5 397B-A17B
240 GB Q4 · 255k ctx
235B · Apache 2.0
Qwen 3 235B-A22B
142 GB Q4 · 128k ctx
235B · Apache 2.0
Qwen 3 VL 235B-A22B
142 GB Q4 · 256k ctx
122B · Apache 2.0
Qwen 3.5 122B-A10B
73 GB Q4 · 255k ctx
80B · Apache 2.0
Qwen3-Coder-Next 80B-A3B
48 GB Q4 · 255k ctx
72B · Qwen License
Qwen 2.5 72B Instruct
42 GB Q4 · 128k ctx
72B · Qwen License
Qwen 2.5 VL 72B
42 GB Q4 · 125k ctx
35B · Apache 2.0
Qwen 3.6 35B-A3B
21 GB Q4 · 255k ctx
32B · Apache 2.0
QwQ 32B
19 GB Q4 · 128k ctx
32B · Apache 2.0
Qwen 2.5 32B
19 GB Q4 · 128k ctx
32B · Apache 2.0
Qwen 2.5 Coder 32B
19 GB Q4 · 128k ctx
32B · Apache 2.0
Qwen 3 32B
19 GB Q4 · 128k ctx
30B · Apache 2.0
Qwen 3 30B-A3B
19 GB Q4 · 128k ctx
30B · Apache 2.0
Qwen 3 Omni 30B-A3B
19 GB Q4 · 128k ctx
30B · Apache 2.0
Qwen 3 VL 30B-A3B
19 GB Q4 · 256k ctx
27B · Apache 2.0
Qwen 3.5 27B
16 GB Q4 · 255k ctx
27B · Apache 2.0
Qwen 3.6 27B
16 GB Q4 · 256k ctx
27B · Qwen License
Qwen 3.6 27B
16 GB Q4 · 250k ctx
14B · Apache 2.0
Qwen 2.5 14B Instruct
9 GB Q4 · 128k ctx
14B · Apache 2.0
Qwen 2.5 Coder 14B Instruct
9 GB Q4 · 128k ctx
14B · Apache 2.0
Qwen 3 14B
9 GB Q4 · 128k ctx
9B · Apache 2.0
Qwen 3.5 9B
6 GB Q4 · 255k ctx
8B · Apache 2.0
Qwen 3 8B
5 GB Q4 · 128k ctx
8B · Apache 2.0
Qwen 3 VL 8B
6 GB Q4 · 256k ctx
7B · Apache 2.0
Qwen 2 VL 7B
6 GB Q4 · 32k ctx
7B · Apache 2.0
Qwen 2.5 7B
5 GB Q4 · 128k ctx
7B · Apache 2.0
Qwen 2.5 Coder 7B
5 GB Q4 · 128k ctx
7B · Apache 2.0
Qwen 2.5 Omni 7B
6 GB Q4 · 32k ctx
7B · Apache 2.0
Qwen 2.5 VL 7B
6 GB Q4 · 125k ctx
3B · Qwen Research License
Qwen 2.5 3B Instruct
2 GB Q4 · 32k ctx
3B · Qwen Research License
Qwen 2.5 Coder 3B Instruct
2 GB Q4 · 32k ctx
1.5B · Apache 2.0
Qwen 2.5 Coder 1.5B Instruct
1 GB Q4 · 32k ctx
0.8B · Apache 2.0
Qwen 3.5 0.8B
0.5 GB Q4 · 250k ctx
Google · 15 models
31B · Gemma
Gemma 4 31B
18 GB Q4 · 250k ctx
27B · Gemma
Gemma 2 27B
16 GB Q4 · 8k ctx
27B · Gemma
Gemma 3 27B
16 GB Q4 · 125k ctx
26B · Gemma
Gemma 4 26B-A4B MoE
16 GB Q4 · 125k ctx
12B · Gemma
Gemma 3 12B
7 GB Q4 · 125k ctx
9B · Gemma
Gemma 2 9B
6 GB Q4 · 8k ctx
4B · Gemma
Gemma 3 4B
10 GB Q4 · 125k ctx
4B · Gemma
Gemma 3n E4B
4.5 GB Q4 · 32k ctx
4B · Gemma
Gemma 4 E4B
10 GB Q4 · 125k ctx
4B · Gemma
MedGemma 1.5 4B
2.3 GB Q4 · 125k ctx
4B · Gemma
MedGemma 4B
2.3 GB Q4 · 125k ctx
2B · Gemma
Gemma 2 2B
1.8 GB Q4 · 8k ctx
2B · Gemma
Gemma 3n E2B
2 GB Q4 · 32k ctx
2B · Gemma
Gemma 4 2B
1.2 GB Q4 · 125k ctx
2B · Gemma
Gemma 4 E2B
7 GB Q4 · 125k ctx
Mistral AI · 15 models
675B · Apache 2.0
Mistral Large 3 675B
405 GB Q4 · 250k ctx
141B · Apache 2.0
Mixtral 8x22B Instruct
82 GB Q4 · 62k ctx
128B · Modified MIT
Mistral Medium 3.5 128B
74 GB Q4 · 250k ctx
119B · Apache 2.0
Mistral Small 4
72 GB Q4 · 250k ctx
47B · Apache 2.0
Mixtral 8x7B
26 GB Q4 · 32k ctx
24B · Apache 2.0
Devstral Small 2 24B
14 GB Q4 · 250k ctx
24B · Apache 2.0
Magistral Small 24B
14 GB Q4 · 125k ctx
24B · Apache 2.0
Mistral Small 3
14 GB Q4 · 32k ctx
24B · Apache 2.0
Mistral Small 3.1 24B
14 GB Q4 · 125k ctx
24B · Apache 2.0
Mistral Small 3.2 24B
14 GB Q4 · 125k ctx
22B · Mistral Non-Production License
Codestral 22B v0.1
13 GB Q4 · 31k ctx
12B · Apache 2.0
Mistral Nemo 12B Instruct
7 GB Q4 · 125k ctx
7B · Apache 2.0
Codestral Mamba 7B
5 GB Q4 · 250k ctx
7B · Apache 2.0
Mistral 7B Instruct
5 GB Q4 · 32k ctx
4B · CC-BY-NC 4.0
Voxtral-4B-TTS
10 GB Q4 · 4k ctx
DeepSeek · 13 models
1600B · MIT
DeepSeek V4 Pro 1.6T
960 GB Q4 · 976k ctx
685B · MIT
DeepSeek V3.2
410 GB Q4 · 125k ctx
671B · MIT
DeepSeek R1 671B
400 GB Q4 · 125k ctx
671B · DeepSeek License
DeepSeek V3 671B
400 GB Q4 · 125k ctx
284B · MIT
DeepSeek V4 Flash 284B
170 GB Q4 · 976k ctx
70B · Llama 3.3 Community + DeepSeek
DeepSeek R1 Distill Llama 70B
40 GB Q4 · 125k ctx
32B · MIT
DeepSeek R1 Distill 32B
19 GB Q4 · 32k ctx
32B · MIT
DeepSeek R2 32B
19 GB Q4 · 125k ctx
16B · MIT
DeepSeek Coder V2 Lite 16B
10 GB Q4 · 128k ctx
14B · MIT
DeepSeek R1 Distill Qwen 14B
9 GB Q4 · 128k ctx
7B · MIT
DeepSeek R1 Distill 7B
5 GB Q4 · 32k ctx
3B · MIT
DeepSeek-OCR
2 GB Q4 · 8k ctx
1.5B · MIT
DeepSeek R1 Distill Qwen 1.5B
1 GB Q4 · 128k ctx
IBM · 9 models
32B · Apache 2.0
Granite 4.0 H-Small 32B-A9B
19 GB Q4 · 125k ctx
30B · Apache 2.0
Granite 4.1 30B Instruct
17 GB Q4 · 128k ctx
8B · Apache 2.0
Granite 3.2 8B Instruct
5 GB Q4 · 125k ctx
8B · Apache 2.0
Granite 3.3 8B Instruct
5 GB Q4 · 125k ctx
8B · Apache 2.0
Granite 4.1 8B Instruct
5 GB Q4 · 128k ctx
7B · Apache 2.0
Granite 4.0 H-Tiny 7B-A1B
4 GB Q4 · 125k ctx
3B · Apache 2.0
Granite 4.0 3B Vision
2.2 GB Q4 · 16k ctx
3B · Apache 2.0
Granite 4.1
1.7 GB Q4 · 125k ctx
3B · Apache 2.0
Granite 4.1 3B Instruct
2 GB Q4 · 128k ctx
Meta · 8 models
405B · Llama 3.1 Community
Llama 3.1 405B Instruct
240 GB Q4 · 125k ctx
400B · Llama 4 Community
Llama 4 Maverick 400B
240 GB Q4 · 976k ctx
109B · Llama 4 Community
Llama 4 Scout 109B
65 GB Q4 · 9765k ctx
70B · Llama 3 Community
Llama 3.1 70B
40 GB Q4 · 128k ctx
70B · Llama 3.3 Community
Llama 3.3 70B Instruct
40 GB Q4 · 125k ctx
11B · Llama 3 Community
Llama 3.2 Vision 11B
8 GB Q4 · 128k ctx
8B · Llama 3 Community
Llama 3.1 8B
6 GB Q4 · 128k ctx
3B · Llama 3 Community
Llama 3.2 3B
2.5 GB Q4 · 128k ctx
NVIDIA · 8 models
120B · NVIDIA Open Model License
Nemotron 3 Super 120B
72 GB Q4 · 125k ctx
70B · Llama 3.1 Community
Llama 3.1 Nemotron 70B
40 GB Q4 · 125k ctx
33B · NVIDIA Open Model License
Nemotron 3 33B
19 GB Q4 · 125k ctx
30B · NVIDIA Open Model License
Nemotron 3 Nano 30B-A3B
17 GB Q4 · 125k ctx
30B · NVIDIA Open Model License
Nemotron 3 Nano Omni 30B-A3B
21 GB Q4 · 250k ctx
30B · NVIDIA Open Model License
Nemotron Cascade 2 30B-A3B
17 GB Q4 · 125k ctx
30B · NVIDIA Open Model License
Nemotron Nano 3 30B-A3B
19 GB Q4 · 976k ctx
12.6B · NVIDIA Open Model License
Nemotron Nano v2 VL 12B
8 GB Q4 · 125k ctx
Allen AI · 7 models
72B · Apache 2.0
Molmo 72B
42 GB Q4 · 4k ctx
70B · Llama 3.1 Community
Tülu 3 70B
40 GB Q4 · 125k ctx
32B · Apache 2.0
OLMo 3 32B
19 GB Q4 · 64k ctx
8B · Llama 3.1 Community
Tülu 3 8B
6 GB Q4 · 125k ctx
7B · Apache 2.0
Molmo 7B-D
5 GB Q4 · 4k ctx
7B · Apache 2.0
OLMo 3 7B
5 GB Q4 · 8k ctx
7B · Apache 2.0
OLMoE 1B-7B Instruct
4 GB Q4 · 4k ctx
Microsoft · 6 models
14B · MIT
Phi-4 14B
9 GB Q4 · 16k ctx
14B · MIT
Phi-4 Reasoning 14B
9 GB Q4 · 32k ctx
5.6B · MIT
Phi-4 Multimodal 5.6B
4 GB Q4 · 125k ctx
3.8B · MIT
Phi-3.5 Mini
10 GB Q4 · 128k ctx
3.8B · MIT
Phi-4 Mini 3.8B
10 GB Q4 · 125k ctx
3.8B · MIT
Phi-4 Mini Reasoning 3.8B
10 GB Q4 · 125k ctx
Cohere For AI · 5 models
35B · CC-BY-NC 4.0
Aya 23 35B
20 GB Q4 · 8k ctx
32B · CC-BY-NC 4.0
Aya Expanse 32B
19 GB Q4 · 8k ctx
8B · CC-BY-NC 4.0
Aya 23 8B
5 GB Q4 · 8k ctx
8B · CC-BY-NC 4.0
Aya Expanse 8B
5 GB Q4 · 8k ctx
3.35B · CC-BY-NC 4.0
Tiny Aya 3.35B
2.2 GB Q4 · 8k ctx
TII · 4 models
10B · TII Falcon-LLM License 2.0
Falcon 3 10B Instruct
6 GB Q4 · 31k ctx
7B · TII Falcon-LLM License 2.0
Falcon 3 7B Instruct
5 GB Q4 · 31k ctx
7B · TII Falcon-LLM License 2.0
Falcon H1R 7B
5 GB Q4 · 32k ctx
7B · TII Falcon-LLM License 2.0
Falcon Mamba 7B
5 GB Q4 · 8k ctx
Tencent · 4 models
406B · Tencent Hunyuan License
Hunyuan Large 2.0
245 GB Q4 · 256k ctx
295B · Tencent Hunyuan License
Tencent Hy3 Preview 295B
177 GB Q4 · 250k ctx
80B · Tencent Hunyuan License
Hunyuan-A13B Instruct
48 GB Q4 · 256k ctx
1B · Tencent Hunyuan License
HunyuanOCR 1B
0.8 GB Q4 · 8k ctx
HuggingFace · 3 models
3B · Apache 2.0
SmolLM3 3B
2 GB Q4 · 125k ctx
2.2B · Apache 2.0
SmolVLM2 2.2B Instruct
1.6 GB Q4 · 8k ctx
1.7B · Apache 2.0
SmolLM2 1.7B Instruct
1.2 GB Q4 · 8k ctx
Xiaomi · 3 models
1020B · MIT
MiMo V2.5 Pro
595 GB Q4 · 976k ctx
310B · MIT
MiMo V2.5
180 GB Q4 · 976k ctx
309B · MIT
MiMo V2 Flash
185 GB Q4 · 125k ctx
01.AI · 2 models
34B · Apache 2.0
Yi 1.5 34B Chat
20 GB Q4 · 4k ctx
9B · Apache 2.0
Yi Coder 9B Chat
5.5 GB Q4 · 125k ctx
Ant Group / inclusionAI · 2 models
BSC · 2 models
40B · Apache 2.0
Salamandra 40B Instruct
24 GB Q4 · 8k ctx
7.7B · Apache 2.0
Salamandra 7B Instruct
5 GB Q4 · 8k ctx
Baidu · 2 models
300B · Apache 2.0
ERNIE 4.5 300B-A47B
180 GB Q4 · 128k ctx
21B · Apache 2.0
ERNIE 4.5 21B-A3B Thinking
13 GB Q4 · 128k ctx
Cohere · 2 models
104B · CC-BY-NC 4.0
Command R+ 104B (08-2024)
60 GB Q4 · 125k ctx
35B · CC-BY-NC 4.0
Command R 35B v01
20 GB Q4 · 125k ctx
Kyutai · 2 models
LMMs-Lab · 2 models
72B · Apache 2.0
LLaVA-OneVision 72B
42 GB Q4 · 32k ctx
7B · Apache 2.0
LLaVA-OneVision 7B
5 GB Q4 · 32k ctx
MBZUAI / Core42 · 2 models
70B · Apache 2.0
Jais Adapted 70B Chat
40 GB Q4 · 4k ctx
30B · Apache 2.0
Jais 30B Chat v3
18 GB Q4 · 8k ctx
Moonshot AI · 2 models
OpenAI · 2 models
OpenBMB · 2 models
8B · MiniCPM Model License
MiniCPM-V 2.6 8B
5.5 GB Q4 · 31k ctx
8B · MiniCPM Model License
MiniCPM-o 2.6 8B
5.5 GB Q4 · 31k ctx
PleIAs · 2 models
Swiss AI · 2 models
AI21 Labs · 1 model
Ant Group · 1 model
Arcee AI · 1 model
ByteDance · 1 model
CroissantLLM · 1 model
Databricks · 1 model
Huawei · 1 model
Kakao · 1 model
LG AI Research · 1 model
LINAGORA · 1 model
Liquid AI · 1 model
MiniMax · 1 model
OpenGPT-X · 1 model
OpenGVLab · 1 model
OpenLLM-France · 1 model
Poolside · 1 model
Rakuten · 1 model
Rednote · 1 model
Sarvam AI · 1 model
Snowflake · 1 model
StepFun · 1 model
Utter Project · 1 model
Utter Project / UE · 1 model
Z.AI · 1 model
Zhipu AI · 1 model
xAI · 1 model