BestLLMfor EN Your hardware. Your LLM. Your call.
APIOpen data Find my LLM
All models

LLM Catalog — 185 models, every license & size.

Filter by hardware fit, license, or use case. Specs, VRAM at every quantization, install command, and benchmark scores for each model. Data shared under CC BY 4.0.

Alibaba · 33 models
397B · Apache 2.0
Qwen 3.5 397B-A17B
240 GB Q4 · 255k ctx
235B · Apache 2.0
Qwen 3 235B-A22B
142 GB Q4 · 128k ctx
235B · Apache 2.0
Qwen 3 VL 235B-A22B
142 GB Q4 · 256k ctx
122B · Apache 2.0
Qwen 3.5 122B-A10B
73 GB Q4 · 255k ctx
80B · Apache 2.0
Qwen3-Coder-Next 80B-A3B
48 GB Q4 · 255k ctx
72B · Qwen License
Qwen 2.5 72B Instruct
42 GB Q4 · 128k ctx
72B · Qwen License
Qwen 2.5 VL 72B
42 GB Q4 · 125k ctx
35B · Apache 2.0
Qwen 3.6 35B-A3B
21 GB Q4 · 255k ctx
32B · Apache 2.0
QwQ 32B
19 GB Q4 · 128k ctx
32B · Apache 2.0
Qwen 2.5 32B
19 GB Q4 · 128k ctx
32B · Apache 2.0
Qwen 2.5 Coder 32B
19 GB Q4 · 128k ctx
32B · Apache 2.0
Qwen 3 32B
19 GB Q4 · 128k ctx
30B · Apache 2.0
Qwen 3 30B-A3B
19 GB Q4 · 128k ctx
30B · Apache 2.0
Qwen 3 Omni 30B-A3B
19 GB Q4 · 128k ctx
30B · Apache 2.0
Qwen 3 VL 30B-A3B
19 GB Q4 · 256k ctx
27B · Apache 2.0
Qwen 3.5 27B
16 GB Q4 · 255k ctx
27B · Apache 2.0
Qwen 3.6 27B
16 GB Q4 · 256k ctx
27B · Qwen License
Qwen 3.6 27B
16 GB Q4 · 250k ctx
14B · Apache 2.0
Qwen 2.5 14B Instruct
9 GB Q4 · 128k ctx
14B · Apache 2.0
Qwen 2.5 Coder 14B Instruct
9 GB Q4 · 128k ctx
14B · Apache 2.0
Qwen 3 14B
9 GB Q4 · 128k ctx
9B · Apache 2.0
Qwen 3.5 9B
6 GB Q4 · 255k ctx
8B · Apache 2.0
Qwen 3 8B
5 GB Q4 · 128k ctx
8B · Apache 2.0
Qwen 3 VL 8B
6 GB Q4 · 256k ctx
7B · Apache 2.0
Qwen 2 VL 7B
6 GB Q4 · 32k ctx
7B · Apache 2.0
Qwen 2.5 7B
5 GB Q4 · 128k ctx
7B · Apache 2.0
Qwen 2.5 Coder 7B
5 GB Q4 · 128k ctx
7B · Apache 2.0
Qwen 2.5 Omni 7B
6 GB Q4 · 32k ctx
7B · Apache 2.0
Qwen 2.5 VL 7B
6 GB Q4 · 125k ctx
3B · Qwen Research License
Qwen 2.5 3B Instruct
2 GB Q4 · 32k ctx
3B · Qwen Research License
Qwen 2.5 Coder 3B Instruct
2 GB Q4 · 32k ctx
1.5B · Apache 2.0
Qwen 2.5 Coder 1.5B Instruct
1 GB Q4 · 32k ctx
0.8B · Apache 2.0
Qwen 3.5 0.8B
0.5 GB Q4 · 250k ctx
Google · 15 models
31B · Gemma
Gemma 4 31B
18 GB Q4 · 250k ctx
27B · Gemma
Gemma 2 27B
16 GB Q4 · 8k ctx
27B · Gemma
Gemma 3 27B
16 GB Q4 · 125k ctx
26B · Gemma
Gemma 4 26B-A4B MoE
16 GB Q4 · 125k ctx
12B · Gemma
Gemma 3 12B
7 GB Q4 · 125k ctx
9B · Gemma
Gemma 2 9B
6 GB Q4 · 8k ctx
4B · Gemma
Gemma 3 4B
10 GB Q4 · 125k ctx
4B · Gemma
Gemma 3n E4B
4.5 GB Q4 · 32k ctx
4B · Gemma
Gemma 4 E4B
10 GB Q4 · 125k ctx
4B · Gemma
MedGemma 1.5 4B
2.3 GB Q4 · 125k ctx
4B · Gemma
MedGemma 4B
2.3 GB Q4 · 125k ctx
2B · Gemma
Gemma 2 2B
1.8 GB Q4 · 8k ctx
2B · Gemma
Gemma 3n E2B
2 GB Q4 · 32k ctx
2B · Gemma
Gemma 4 2B
1.2 GB Q4 · 125k ctx
2B · Gemma
Gemma 4 E2B
7 GB Q4 · 125k ctx
Mistral AI · 15 models
675B · Apache 2.0
Mistral Large 3 675B
405 GB Q4 · 250k ctx
141B · Apache 2.0
Mixtral 8x22B Instruct
82 GB Q4 · 62k ctx
128B · Modified MIT
Mistral Medium 3.5 128B
74 GB Q4 · 250k ctx
119B · Apache 2.0
Mistral Small 4
72 GB Q4 · 250k ctx
47B · Apache 2.0
Mixtral 8x7B
26 GB Q4 · 32k ctx
24B · Apache 2.0
Devstral Small 2 24B
14 GB Q4 · 250k ctx
24B · Apache 2.0
Magistral Small 24B
14 GB Q4 · 125k ctx
24B · Apache 2.0
Mistral Small 3
14 GB Q4 · 32k ctx
24B · Apache 2.0
Mistral Small 3.1 24B
14 GB Q4 · 125k ctx
24B · Apache 2.0
Mistral Small 3.2 24B
14 GB Q4 · 125k ctx
22B · Mistral Non-Production License
Codestral 22B v0.1
13 GB Q4 · 31k ctx
12B · Apache 2.0
Mistral Nemo 12B Instruct
7 GB Q4 · 125k ctx
7B · Apache 2.0
Codestral Mamba 7B
5 GB Q4 · 250k ctx
7B · Apache 2.0
Mistral 7B Instruct
5 GB Q4 · 32k ctx
4B · CC-BY-NC 4.0
Voxtral-4B-TTS
10 GB Q4 · 4k ctx
DeepSeek · 13 models
1600B · MIT
DeepSeek V4 Pro 1.6T
960 GB Q4 · 976k ctx
685B · MIT
DeepSeek V3.2
410 GB Q4 · 125k ctx
671B · MIT
DeepSeek R1 671B
400 GB Q4 · 125k ctx
671B · DeepSeek License
DeepSeek V3 671B
400 GB Q4 · 125k ctx
284B · MIT
DeepSeek V4 Flash 284B
170 GB Q4 · 976k ctx
70B · Llama 3.3 Community + DeepSeek
DeepSeek R1 Distill Llama 70B
40 GB Q4 · 125k ctx
32B · MIT
DeepSeek R1 Distill 32B
19 GB Q4 · 32k ctx
32B · MIT
DeepSeek R2 32B
19 GB Q4 · 125k ctx
16B · MIT
DeepSeek Coder V2 Lite 16B
10 GB Q4 · 128k ctx
14B · MIT
DeepSeek R1 Distill Qwen 14B
9 GB Q4 · 128k ctx
7B · MIT
DeepSeek R1 Distill 7B
5 GB Q4 · 32k ctx
3B · MIT
DeepSeek-OCR
2 GB Q4 · 8k ctx
1.5B · MIT
DeepSeek R1 Distill Qwen 1.5B
1 GB Q4 · 128k ctx
IBM · 9 models
32B · Apache 2.0
Granite 4.0 H-Small 32B-A9B
19 GB Q4 · 125k ctx
30B · Apache 2.0
Granite 4.1 30B Instruct
17 GB Q4 · 128k ctx
8B · Apache 2.0
Granite 3.2 8B Instruct
5 GB Q4 · 125k ctx
8B · Apache 2.0
Granite 3.3 8B Instruct
5 GB Q4 · 125k ctx
8B · Apache 2.0
Granite 4.1 8B Instruct
5 GB Q4 · 128k ctx
7B · Apache 2.0
Granite 4.0 H-Tiny 7B-A1B
4 GB Q4 · 125k ctx
3B · Apache 2.0
Granite 4.0 3B Vision
2.2 GB Q4 · 16k ctx
3B · Apache 2.0
Granite 4.1
1.7 GB Q4 · 125k ctx
3B · Apache 2.0
Granite 4.1 3B Instruct
2 GB Q4 · 128k ctx
Meta · 8 models
405B · Llama 3.1 Community
Llama 3.1 405B Instruct
240 GB Q4 · 125k ctx
400B · Llama 4 Community
Llama 4 Maverick 400B
240 GB Q4 · 976k ctx
109B · Llama 4 Community
Llama 4 Scout 109B
65 GB Q4 · 9765k ctx
70B · Llama 3 Community
Llama 3.1 70B
40 GB Q4 · 128k ctx
70B · Llama 3.3 Community
Llama 3.3 70B Instruct
40 GB Q4 · 125k ctx
11B · Llama 3 Community
Llama 3.2 Vision 11B
8 GB Q4 · 128k ctx
8B · Llama 3 Community
Llama 3.1 8B
6 GB Q4 · 128k ctx
3B · Llama 3 Community
Llama 3.2 3B
2.5 GB Q4 · 128k ctx
NVIDIA · 8 models
120B · NVIDIA Open Model License
Nemotron 3 Super 120B
72 GB Q4 · 125k ctx
70B · Llama 3.1 Community
Llama 3.1 Nemotron 70B
40 GB Q4 · 125k ctx
33B · NVIDIA Open Model License
Nemotron 3 33B
19 GB Q4 · 125k ctx
30B · NVIDIA Open Model License
Nemotron 3 Nano 30B-A3B
17 GB Q4 · 125k ctx
30B · NVIDIA Open Model License
Nemotron 3 Nano Omni 30B-A3B
21 GB Q4 · 250k ctx
30B · NVIDIA Open Model License
Nemotron Cascade 2 30B-A3B
17 GB Q4 · 125k ctx
30B · NVIDIA Open Model License
Nemotron Nano 3 30B-A3B
19 GB Q4 · 976k ctx
12.6B · NVIDIA Open Model License
Nemotron Nano v2 VL 12B
8 GB Q4 · 125k ctx
Allen AI · 7 models
72B · Apache 2.0
Molmo 72B
42 GB Q4 · 4k ctx
70B · Llama 3.1 Community
Tülu 3 70B
40 GB Q4 · 125k ctx
32B · Apache 2.0
OLMo 3 32B
19 GB Q4 · 64k ctx
8B · Llama 3.1 Community
Tülu 3 8B
6 GB Q4 · 125k ctx
7B · Apache 2.0
Molmo 7B-D
5 GB Q4 · 4k ctx
7B · Apache 2.0
OLMo 3 7B
5 GB Q4 · 8k ctx
7B · Apache 2.0
OLMoE 1B-7B Instruct
4 GB Q4 · 4k ctx
Microsoft · 6 models
14B · MIT
Phi-4 14B
9 GB Q4 · 16k ctx
14B · MIT
Phi-4 Reasoning 14B
9 GB Q4 · 32k ctx
5.6B · MIT
Phi-4 Multimodal 5.6B
4 GB Q4 · 125k ctx
3.8B · MIT
Phi-3.5 Mini
10 GB Q4 · 128k ctx
3.8B · MIT
Phi-4 Mini 3.8B
10 GB Q4 · 125k ctx
3.8B · MIT
Phi-4 Mini Reasoning 3.8B
10 GB Q4 · 125k ctx
Cohere For AI · 5 models
35B · CC-BY-NC 4.0
Aya 23 35B
20 GB Q4 · 8k ctx
32B · CC-BY-NC 4.0
Aya Expanse 32B
19 GB Q4 · 8k ctx
8B · CC-BY-NC 4.0
Aya 23 8B
5 GB Q4 · 8k ctx
8B · CC-BY-NC 4.0
Aya Expanse 8B
5 GB Q4 · 8k ctx
3.35B · CC-BY-NC 4.0
Tiny Aya 3.35B
2.2 GB Q4 · 8k ctx
TII · 4 models
10B · TII Falcon-LLM License 2.0
Falcon 3 10B Instruct
6 GB Q4 · 31k ctx
7B · TII Falcon-LLM License 2.0
Falcon 3 7B Instruct
5 GB Q4 · 31k ctx
7B · TII Falcon-LLM License 2.0
Falcon H1R 7B
5 GB Q4 · 32k ctx
7B · TII Falcon-LLM License 2.0
Falcon Mamba 7B
5 GB Q4 · 8k ctx
Tencent · 4 models
406B · Tencent Hunyuan License
Hunyuan Large 2.0
245 GB Q4 · 256k ctx
295B · Tencent Hunyuan License
Tencent Hy3 Preview 295B
177 GB Q4 · 250k ctx
80B · Tencent Hunyuan License
Hunyuan-A13B Instruct
48 GB Q4 · 256k ctx
1B · Tencent Hunyuan License
HunyuanOCR 1B
0.8 GB Q4 · 8k ctx
HuggingFace · 3 models
3B · Apache 2.0
SmolLM3 3B
2 GB Q4 · 125k ctx
2.2B · Apache 2.0
SmolVLM2 2.2B Instruct
1.6 GB Q4 · 8k ctx
1.7B · Apache 2.0
SmolLM2 1.7B Instruct
1.2 GB Q4 · 8k ctx
Xiaomi · 3 models
1020B · MIT
MiMo V2.5 Pro
595 GB Q4 · 976k ctx
310B · MIT
MiMo V2.5
180 GB Q4 · 976k ctx
309B · MIT
MiMo V2 Flash
185 GB Q4 · 125k ctx
01.AI · 2 models
34B · Apache 2.0
Yi 1.5 34B Chat
20 GB Q4 · 4k ctx
9B · Apache 2.0
Yi Coder 9B Chat
5.5 GB Q4 · 125k ctx
Ant Group / inclusionAI · 2 models
1000B · MIT
Ling 2.6 1T
580 GB Q4 · 256k ctx
16B · Apache 2.0
LLaDA 2.0 Uni 16B
18 GB Q4 · 8k ctx
BSC · 2 models
40B · Apache 2.0
Salamandra 40B Instruct
24 GB Q4 · 8k ctx
7.7B · Apache 2.0
Salamandra 7B Instruct
5 GB Q4 · 8k ctx
Baidu · 2 models
300B · Apache 2.0
ERNIE 4.5 300B-A47B
180 GB Q4 · 128k ctx
21B · Apache 2.0
ERNIE 4.5 21B-A3B Thinking
13 GB Q4 · 128k ctx
Cohere · 2 models
104B · CC-BY-NC 4.0
Command R+ 104B (08-2024)
60 GB Q4 · 125k ctx
35B · CC-BY-NC 4.0
Command R 35B v01
20 GB Q4 · 125k ctx
Kyutai · 2 models
7.6B · CC-BY 4.0
Moshi 7B
5 GB Q4 · 4k ctx
2B · CC-BY-SA 4.0
Helium 1 2B
1.5 GB Q4 · 4k ctx
LMMs-Lab · 2 models
72B · Apache 2.0
LLaVA-OneVision 72B
42 GB Q4 · 32k ctx
7B · Apache 2.0
LLaVA-OneVision 7B
5 GB Q4 · 32k ctx
MBZUAI / Core42 · 2 models
70B · Apache 2.0
Jais Adapted 70B Chat
40 GB Q4 · 4k ctx
30B · Apache 2.0
Jais 30B Chat v3
18 GB Q4 · 8k ctx
Moonshot AI · 2 models
1000B · Modified MIT
Kimi K2.5
600 GB Q4 · 250k ctx
1000B · Modified MIT
Kimi K2.6
600 GB Q4 · 250k ctx
OpenAI · 2 models
117B · Apache 2.0
gpt-oss 120B
70 GB Q4 · 125k ctx
21B · Apache 2.0
gpt-oss 20B
13 GB Q4 · 125k ctx
OpenBMB · 2 models
8B · MiniCPM Model License
MiniCPM-V 2.6 8B
5.5 GB Q4 · 31k ctx
8B · MiniCPM Model License
MiniCPM-o 2.6 8B
5.5 GB Q4 · 31k ctx
PleIAs · 2 models
3B · Apache 2.0
Pleias 3B Preview
2 GB Q4 · 2k ctx
1.2B · Apache 2.0
Pleias-RAG 1B
0.8 GB Q4 · 2k ctx
Swiss AI · 2 models
70B · Apache 2.0
Apertus 70B
40 GB Q4 · 64k ctx
8B · Apache 2.0
Apertus 8B
6 GB Q4 · 64k ctx
AI21 Labs · 1 model
52B · Jamba Open Model License
Jamba 1.5 Mini
30 GB Q4 · 250k ctx
Ant Group · 1 model
1000B · MIT
Ring-1T
600 GB Q4 · 128k ctx
Arcee AI · 1 model
26B · Apache 2.0
Trinity Mini 26B-A3B
15 GB Q4 · 128k ctx
ByteDance · 1 model
36B · Apache 2.0
Seed-OSS 36B Instruct
22 GB Q4 · 512k ctx
CroissantLLM · 1 model
1.3B · MIT
CroissantLLM 1.3B
1 GB Q4 · 2k ctx
Databricks · 1 model
132B · Databricks Open Model License
DBRX Instruct
76 GB Q4 · 32k ctx
Huawei · 1 model
72B · Pangu Model License
Pangu Pro MoE 72B
42 GB Q4 · 32k ctx
Kakao · 1 model
30B · Apache 2.0
Kanana 2 30B-A3B Thinking
18 GB Q4 · 128k ctx
LG AI Research · 1 model
33B · EXAONE AI Model License
EXAONE 4.5 33B
20 GB Q4 · 256k ctx
LINAGORA · 1 model
7B · CC-BY-NC-SA 4.0
Claire 7B 0.1
5 GB Q4 · 2k ctx
Liquid AI · 1 model
1.2B · LFM Open License v1.0
LFM2.5 Thinking 1.2B
0.7 GB Q4 · 32k ctx
MiniMax · 1 model
229B · Apache 2.0
MiniMax-M2.7
138 GB Q4 · 200k ctx
OpenGPT-X · 1 model
7B · Apache 2.0 (commercial)
Teuken 7B Instruct
5 GB Q4 · 4k ctx
OpenGVLab · 1 model
8B · Apache 2.0
InternVL 3.5 8B
6 GB Q4 · 32k ctx
OpenLLM-France · 1 model
7B · Apache 2.0
Lucie 7B
5 GB Q4 · 4k ctx
Poolside · 1 model
33B · Apache 2.0
Laguna XS.2
19 GB Q4 · 128k ctx
Rakuten · 1 model
700B · Apache 2.0
Rakuten AI 3.0
420 GB Q4 · 32k ctx
Rednote · 1 model
142B · MIT
dots.llm1 Instruct
85 GB Q4 · 32k ctx
Sarvam AI · 1 model
24B · Apache 2.0
Sarvam-M 24B
14 GB Q4 · 32k ctx
Snowflake · 1 model
480B · Apache 2.0
Snowflake Arctic Instruct
290 GB Q4 · 4k ctx
StepFun · 1 model
196B · Apache 2.0
Step 3.5 Flash
118 GB Q4 · 250k ctx
Utter Project · 1 model
22.6B · Apache 2.0
EuroLLM 22B Instruct 2512
13 GB Q4 · 32k ctx
Utter Project / UE · 1 model
9B · Apache 2.0
EuroLLM 9B Instruct
6 GB Q4 · 4k ctx
Z.AI · 1 model
744B · MIT
GLM-5.1
445 GB Q4 · 195k ctx
Zhipu AI · 1 model
3B · MIT
GLM 4.7 Flash
1.7 GB Q4 · 125k ctx
xAI · 1 model
314B · Apache 2.0
Grok-1 (base)
188 GB Q4 · 8k ctx