BestLLMfor EN Your hardware. Your LLM. Your call.

APIOpen data Find my LLM

All models

LLM Catalog — 185 models, every license & size.

Filter by hardware fit, license, or use case. Specs, VRAM at every quantization, install command, and benchmark scores for each model. Data shared under CC BY 4.0.

Alibaba · 33 models

397B · Apache 2.0

Qwen 3.5 397B-A17B

240 GB Q4 · 255k ctx

235B · Apache 2.0

Qwen 3 235B-A22B

142 GB Q4 · 128k ctx

235B · Apache 2.0

Qwen 3 VL 235B-A22B

142 GB Q4 · 256k ctx

122B · Apache 2.0

Qwen 3.5 122B-A10B

73 GB Q4 · 255k ctx

80B · Apache 2.0

Qwen3-Coder-Next 80B-A3B

48 GB Q4 · 255k ctx

72B · Qwen License

Qwen 2.5 72B Instruct

42 GB Q4 · 128k ctx

72B · Qwen License

Qwen 2.5 VL 72B

42 GB Q4 · 125k ctx

35B · Apache 2.0

Qwen 3.6 35B-A3B

21 GB Q4 · 255k ctx

32B · Apache 2.0

19 GB Q4 · 128k ctx

32B · Apache 2.0

19 GB Q4 · 128k ctx

32B · Apache 2.0

Qwen 2.5 Coder 32B

19 GB Q4 · 128k ctx

32B · Apache 2.0

19 GB Q4 · 128k ctx

30B · Apache 2.0

19 GB Q4 · 128k ctx

30B · Apache 2.0

Qwen 3 Omni 30B-A3B

19 GB Q4 · 128k ctx

30B · Apache 2.0

Qwen 3 VL 30B-A3B

19 GB Q4 · 256k ctx

27B · Apache 2.0

16 GB Q4 · 255k ctx

27B · Apache 2.0

16 GB Q4 · 256k ctx

27B · Qwen License

16 GB Q4 · 250k ctx

14B · Apache 2.0

Qwen 2.5 14B Instruct

9 GB Q4 · 128k ctx

14B · Apache 2.0

Qwen 2.5 Coder 14B Instruct

9 GB Q4 · 128k ctx

14B · Apache 2.0

9 GB Q4 · 128k ctx

9B · Apache 2.0

6 GB Q4 · 255k ctx

8B · Apache 2.0

5 GB Q4 · 128k ctx

8B · Apache 2.0

6 GB Q4 · 256k ctx

7B · Apache 2.0

6 GB Q4 · 32k ctx

7B · Apache 2.0

5 GB Q4 · 128k ctx

7B · Apache 2.0

Qwen 2.5 Coder 7B

5 GB Q4 · 128k ctx

7B · Apache 2.0

Qwen 2.5 Omni 7B

6 GB Q4 · 32k ctx

7B · Apache 2.0

6 GB Q4 · 125k ctx

3B · Qwen Research License

Qwen 2.5 3B Instruct

2 GB Q4 · 32k ctx

3B · Qwen Research License

Qwen 2.5 Coder 3B Instruct

2 GB Q4 · 32k ctx

1.5B · Apache 2.0

Qwen 2.5 Coder 1.5B Instruct

1 GB Q4 · 32k ctx

0.8B · Apache 2.0

0.5 GB Q4 · 250k ctx

Google · 15 models

18 GB Q4 · 250k ctx

16 GB Q4 · 8k ctx

16 GB Q4 · 125k ctx

Gemma 4 26B-A4B MoE

16 GB Q4 · 125k ctx

7 GB Q4 · 125k ctx

6 GB Q4 · 8k ctx

10 GB Q4 · 125k ctx

4.5 GB Q4 · 32k ctx

10 GB Q4 · 125k ctx

MedGemma 1.5 4B

2.3 GB Q4 · 125k ctx

2.3 GB Q4 · 125k ctx

1.8 GB Q4 · 8k ctx

2 GB Q4 · 32k ctx

1.2 GB Q4 · 125k ctx

7 GB Q4 · 125k ctx

Mistral AI · 15 models

675B · Apache 2.0

Mistral Large 3 675B

405 GB Q4 · 250k ctx

141B · Apache 2.0

Mixtral 8x22B Instruct

82 GB Q4 · 62k ctx

128B · Modified MIT

Mistral Medium 3.5 128B

74 GB Q4 · 250k ctx

119B · Apache 2.0

Mistral Small 4

72 GB Q4 · 250k ctx

47B · Apache 2.0

26 GB Q4 · 32k ctx

24B · Apache 2.0

Devstral Small 2 24B

14 GB Q4 · 250k ctx

24B · Apache 2.0

Magistral Small 24B

14 GB Q4 · 125k ctx

24B · Apache 2.0

Mistral Small 3

14 GB Q4 · 32k ctx

24B · Apache 2.0

Mistral Small 3.1 24B

14 GB Q4 · 125k ctx

24B · Apache 2.0

Mistral Small 3.2 24B

14 GB Q4 · 125k ctx

22B · Mistral Non-Production License

Codestral 22B v0.1

13 GB Q4 · 31k ctx

12B · Apache 2.0

Mistral Nemo 12B Instruct

7 GB Q4 · 125k ctx

7B · Apache 2.0

Codestral Mamba 7B

5 GB Q4 · 250k ctx

7B · Apache 2.0

Mistral 7B Instruct

5 GB Q4 · 32k ctx

4B · CC-BY-NC 4.0

10 GB Q4 · 4k ctx

DeepSeek · 13 models

DeepSeek V4 Pro 1.6T

960 GB Q4 · 976k ctx

410 GB Q4 · 125k ctx

DeepSeek R1 671B

400 GB Q4 · 125k ctx

671B · DeepSeek License

DeepSeek V3 671B

400 GB Q4 · 125k ctx

DeepSeek V4 Flash 284B

170 GB Q4 · 976k ctx

70B · Llama 3.3 Community + DeepSeek

DeepSeek R1 Distill Llama 70B

40 GB Q4 · 125k ctx

DeepSeek R1 Distill 32B

19 GB Q4 · 32k ctx

DeepSeek R2 32B

19 GB Q4 · 125k ctx

DeepSeek Coder V2 Lite 16B

10 GB Q4 · 128k ctx

DeepSeek R1 Distill Qwen 14B

9 GB Q4 · 128k ctx

DeepSeek R1 Distill 7B

5 GB Q4 · 32k ctx

2 GB Q4 · 8k ctx

DeepSeek R1 Distill Qwen 1.5B

1 GB Q4 · 128k ctx

IBM · 9 models

32B · Apache 2.0

Granite 4.0 H-Small 32B-A9B

19 GB Q4 · 125k ctx

30B · Apache 2.0

Granite 4.1 30B Instruct

17 GB Q4 · 128k ctx

8B · Apache 2.0

Granite 3.2 8B Instruct

5 GB Q4 · 125k ctx

8B · Apache 2.0

Granite 3.3 8B Instruct

5 GB Q4 · 125k ctx

8B · Apache 2.0

Granite 4.1 8B Instruct

5 GB Q4 · 128k ctx

7B · Apache 2.0

Granite 4.0 H-Tiny 7B-A1B

4 GB Q4 · 125k ctx

3B · Apache 2.0

Granite 4.0 3B Vision

2.2 GB Q4 · 16k ctx

3B · Apache 2.0

1.7 GB Q4 · 125k ctx

3B · Apache 2.0

Granite 4.1 3B Instruct

2 GB Q4 · 128k ctx

Meta · 8 models

405B · Llama 3.1 Community

Llama 3.1 405B Instruct

240 GB Q4 · 125k ctx

400B · Llama 4 Community

Llama 4 Maverick 400B

240 GB Q4 · 976k ctx

109B · Llama 4 Community

Llama 4 Scout 109B

65 GB Q4 · 9765k ctx

70B · Llama 3 Community

40 GB Q4 · 128k ctx

70B · Llama 3.3 Community

Llama 3.3 70B Instruct

40 GB Q4 · 125k ctx

11B · Llama 3 Community

Llama 3.2 Vision 11B

8 GB Q4 · 128k ctx

8B · Llama 3 Community

6 GB Q4 · 128k ctx

3B · Llama 3 Community

2.5 GB Q4 · 128k ctx

NVIDIA · 8 models

120B · NVIDIA Open Model License

Nemotron 3 Super 120B

72 GB Q4 · 125k ctx

70B · Llama 3.1 Community

Llama 3.1 Nemotron 70B

40 GB Q4 · 125k ctx

33B · NVIDIA Open Model License

19 GB Q4 · 125k ctx

30B · NVIDIA Open Model License

Nemotron 3 Nano 30B-A3B

17 GB Q4 · 125k ctx

30B · NVIDIA Open Model License

Nemotron 3 Nano Omni 30B-A3B

21 GB Q4 · 250k ctx

30B · NVIDIA Open Model License

Nemotron Cascade 2 30B-A3B

17 GB Q4 · 125k ctx

30B · NVIDIA Open Model License

Nemotron Nano 3 30B-A3B

19 GB Q4 · 976k ctx

12.6B · NVIDIA Open Model License

Nemotron Nano v2 VL 12B

8 GB Q4 · 125k ctx

Allen AI · 7 models

72B · Apache 2.0

42 GB Q4 · 4k ctx

70B · Llama 3.1 Community

40 GB Q4 · 125k ctx

32B · Apache 2.0

19 GB Q4 · 64k ctx

8B · Llama 3.1 Community

6 GB Q4 · 125k ctx

7B · Apache 2.0

5 GB Q4 · 4k ctx

7B · Apache 2.0

5 GB Q4 · 8k ctx

7B · Apache 2.0

OLMoE 1B-7B Instruct

4 GB Q4 · 4k ctx

Microsoft · 6 models

9 GB Q4 · 16k ctx

Phi-4 Reasoning 14B

9 GB Q4 · 32k ctx

Phi-4 Multimodal 5.6B

4 GB Q4 · 125k ctx

10 GB Q4 · 128k ctx

Phi-4 Mini 3.8B

10 GB Q4 · 125k ctx

Phi-4 Mini Reasoning 3.8B

10 GB Q4 · 125k ctx

Cohere For AI · 5 models

35B · CC-BY-NC 4.0

20 GB Q4 · 8k ctx

32B · CC-BY-NC 4.0

Aya Expanse 32B

19 GB Q4 · 8k ctx

8B · CC-BY-NC 4.0

5 GB Q4 · 8k ctx

8B · CC-BY-NC 4.0

5 GB Q4 · 8k ctx

3.35B · CC-BY-NC 4.0

2.2 GB Q4 · 8k ctx

TII · 4 models

10B · TII Falcon-LLM License 2.0

Falcon 3 10B Instruct

6 GB Q4 · 31k ctx

7B · TII Falcon-LLM License 2.0

Falcon 3 7B Instruct

5 GB Q4 · 31k ctx

7B · TII Falcon-LLM License 2.0

5 GB Q4 · 32k ctx

7B · TII Falcon-LLM License 2.0

Falcon Mamba 7B

5 GB Q4 · 8k ctx

Tencent · 4 models

406B · Tencent Hunyuan License

Hunyuan Large 2.0

245 GB Q4 · 256k ctx

295B · Tencent Hunyuan License

Tencent Hy3 Preview 295B

177 GB Q4 · 250k ctx

80B · Tencent Hunyuan License

Hunyuan-A13B Instruct

48 GB Q4 · 256k ctx

1B · Tencent Hunyuan License

0.8 GB Q4 · 8k ctx

HuggingFace · 3 models

3B · Apache 2.0

2 GB Q4 · 125k ctx

2.2B · Apache 2.0

SmolVLM2 2.2B Instruct

1.6 GB Q4 · 8k ctx

1.7B · Apache 2.0

SmolLM2 1.7B Instruct

1.2 GB Q4 · 8k ctx

Xiaomi · 3 models

595 GB Q4 · 976k ctx

180 GB Q4 · 976k ctx

185 GB Q4 · 125k ctx

01.AI · 2 models

34B · Apache 2.0

Yi 1.5 34B Chat

20 GB Q4 · 4k ctx

9B · Apache 2.0

Yi Coder 9B Chat

5.5 GB Q4 · 125k ctx

Ant Group / inclusionAI · 2 models

580 GB Q4 · 256k ctx

16B · Apache 2.0

LLaDA 2.0 Uni 16B

18 GB Q4 · 8k ctx

BSC · 2 models

40B · Apache 2.0

Salamandra 40B Instruct

24 GB Q4 · 8k ctx

7.7B · Apache 2.0

Salamandra 7B Instruct

5 GB Q4 · 8k ctx

Baidu · 2 models

300B · Apache 2.0

ERNIE 4.5 300B-A47B

180 GB Q4 · 128k ctx

21B · Apache 2.0

ERNIE 4.5 21B-A3B Thinking

13 GB Q4 · 128k ctx

Cohere · 2 models

104B · CC-BY-NC 4.0

Command R+ 104B (08-2024)

60 GB Q4 · 125k ctx

35B · CC-BY-NC 4.0

Command R 35B v01

20 GB Q4 · 125k ctx

Kyutai · 2 models

7.6B · CC-BY 4.0

5 GB Q4 · 4k ctx

2B · CC-BY-SA 4.0

1.5 GB Q4 · 4k ctx

LMMs-Lab · 2 models

72B · Apache 2.0

LLaVA-OneVision 72B

42 GB Q4 · 32k ctx

7B · Apache 2.0

LLaVA-OneVision 7B

5 GB Q4 · 32k ctx

MBZUAI / Core42 · 2 models

70B · Apache 2.0

Jais Adapted 70B Chat

40 GB Q4 · 4k ctx

30B · Apache 2.0

Jais 30B Chat v3

18 GB Q4 · 8k ctx

Moonshot AI · 2 models

1000B · Modified MIT

600 GB Q4 · 250k ctx

1000B · Modified MIT

600 GB Q4 · 250k ctx

OpenAI · 2 models

117B · Apache 2.0

70 GB Q4 · 125k ctx

21B · Apache 2.0

13 GB Q4 · 125k ctx

OpenBMB · 2 models

8B · MiniCPM Model License

MiniCPM-V 2.6 8B

5.5 GB Q4 · 31k ctx

8B · MiniCPM Model License

MiniCPM-o 2.6 8B

5.5 GB Q4 · 31k ctx

PleIAs · 2 models

3B · Apache 2.0

Pleias 3B Preview

2 GB Q4 · 2k ctx

1.2B · Apache 2.0

0.8 GB Q4 · 2k ctx

Swiss AI · 2 models

70B · Apache 2.0

40 GB Q4 · 64k ctx

8B · Apache 2.0

6 GB Q4 · 64k ctx

AI21 Labs · 1 model

52B · Jamba Open Model License

30 GB Q4 · 250k ctx

Ant Group · 1 model

600 GB Q4 · 128k ctx

Arcee AI · 1 model

26B · Apache 2.0

Trinity Mini 26B-A3B

15 GB Q4 · 128k ctx

ByteDance · 1 model

36B · Apache 2.0

Seed-OSS 36B Instruct

22 GB Q4 · 512k ctx

CroissantLLM · 1 model

CroissantLLM 1.3B

1 GB Q4 · 2k ctx

Databricks · 1 model

132B · Databricks Open Model License

76 GB Q4 · 32k ctx

Huawei · 1 model

72B · Pangu Model License

Pangu Pro MoE 72B

42 GB Q4 · 32k ctx

Kakao · 1 model

30B · Apache 2.0

Kanana 2 30B-A3B Thinking

18 GB Q4 · 128k ctx

LG AI Research · 1 model

33B · EXAONE AI Model License

20 GB Q4 · 256k ctx

LINAGORA · 1 model

7B · CC-BY-NC-SA 4.0

5 GB Q4 · 2k ctx

Liquid AI · 1 model

1.2B · LFM Open License v1.0

LFM2.5 Thinking 1.2B

0.7 GB Q4 · 32k ctx

MiniMax · 1 model

229B · Apache 2.0

138 GB Q4 · 200k ctx

OpenGPT-X · 1 model

7B · Apache 2.0 (commercial)

Teuken 7B Instruct

5 GB Q4 · 4k ctx

OpenGVLab · 1 model

8B · Apache 2.0

InternVL 3.5 8B

6 GB Q4 · 32k ctx

OpenLLM-France · 1 model

7B · Apache 2.0

5 GB Q4 · 4k ctx

Poolside · 1 model

33B · Apache 2.0

19 GB Q4 · 128k ctx

Rakuten · 1 model

700B · Apache 2.0

420 GB Q4 · 32k ctx

Rednote · 1 model

dots.llm1 Instruct

85 GB Q4 · 32k ctx

Sarvam AI · 1 model

24B · Apache 2.0

14 GB Q4 · 32k ctx

Snowflake · 1 model

480B · Apache 2.0

Snowflake Arctic Instruct

290 GB Q4 · 4k ctx

StepFun · 1 model

196B · Apache 2.0

118 GB Q4 · 250k ctx

Utter Project · 1 model

22.6B · Apache 2.0

EuroLLM 22B Instruct 2512

13 GB Q4 · 32k ctx

Utter Project / UE · 1 model

9B · Apache 2.0

EuroLLM 9B Instruct

6 GB Q4 · 4k ctx

Z.AI · 1 model

445 GB Q4 · 195k ctx

Zhipu AI · 1 model

1.7 GB Q4 · 125k ctx

xAI · 1 model

314B · Apache 2.0

188 GB Q4 · 8k ctx