Vision
updated
liuhaotian/llava-v1.6-34b
Image-Text-to-Text
•
35B
•
Updated
•
26.4k
•
358
deepseek-ai/deepseek-vl-7b-base
7B
•
Updated
•
269
•
64
deepseek-ai/deepseek-vl-7b-chat
Image-Text-to-Text
•
7B
•
Updated
•
2.91k
•
268
HuggingFaceM4/idefics2-8b
Image-Text-to-Text
•
8B
•
Updated
•
3.29k
•
620
HuggingFaceM4/idefics2-8b-chatty
Image-Text-to-Text
•
8B
•
Updated
•
58
•
95
HuggingFaceM4/idefics2-8b-base
Image-Text-to-Text
•
8B
•
Updated
•
1.5k
•
28
google/paligemma-3b-pt-896
Image-Text-to-Text
•
3B
•
Updated
•
404
•
123
microsoft/Phi-3-vision-128k-instruct
Text Generation
•
4B
•
Updated
•
34.3k
•
970
Image-Text-to-Text
•
7B
•
Updated
•
43.3k
•
197
microsoft/Phi-3.5-vision-instruct
Image-Text-to-Text
•
4B
•
Updated
•
681k
•
724
meta-llama/Llama-3.2-11B-Vision
Image-Text-to-Text
•
11B
•
Updated
•
8.42k
•
578
meta-llama/Llama-3.2-11B-Vision-Instruct
Image-Text-to-Text
•
11B
•
Updated
•
95.4k
•
•
1.55k
meta-llama/Llama-3.2-90B-Vision
Image-Text-to-Text
•
89B
•
Updated
•
2.38k
•
133
meta-llama/Llama-3.2-90B-Vision-Instruct
Image-Text-to-Text
•
89B
•
Updated
•
35.6k
•
•
348
meta-llama/Llama-Guard-3-11B-Vision
Image-Text-to-Text
•
11B
•
Updated
•
438
•
67
Image-Text-to-Text
•
73B
•
Updated
•
531
•
295
Image-Text-to-Text
•
8B
•
Updated
•
12.7k
•
561
Image-Text-to-Text
•
8B
•
Updated
•
2.13k
•
162
Image-Text-to-Text
•
Updated
•
1.13k
•
156
Text-to-Video
•
Updated
•
2.6k
•
•
1.3k
Image-Text-to-Text
•
Updated
•
352
•
1.7k
Image-to-Video
•
Updated
•
137k
•
•
2.09k