llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2026-06-30 00:00:23 +00:00

Files

T

JJJYmmm fc0fe40049 models : support qwen3.5 series (#19468 )

* support qwen3.5 series

* remove deepstack for now, and some code clean

* code clean

* add FULL_ATTENTION_INTERVAL metadata

* code clean

* reorder v heads for linear attention to avoid expensive interleaved repeat

2026-02-10 18:00:26 +02:00

cogvlm.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

conformer.cpp

mtmd : Fix ASR for LFM2.5-Audio-1.5B (#18876 )

2026-01-16 11:23:08 +01:00

glm4v.cpp

model: support GLM4V vision encoder (#18042 )

2025-12-16 11:25:26 +01:00

internvl.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

kimivl.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

llama4.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

llava.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

minicpmv.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

mobilenetv5.cpp

mtmd: Add Gemma3n multimodal support with MobileNetV5 vision encoder (#18256 )

2026-01-09 23:42:38 +01:00

models.h

mtmd: Add Gemma3n multimodal support with MobileNetV5 vision encoder (#18256 )

2026-01-09 23:42:38 +01:00

pixtral.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

qwen2vl.cpp

clip: move model cgraphs into their own files (#17965 )

2025-12-12 21:14:48 +01:00

qwen3vl.cpp

models : support qwen3.5 series (#19468 )

2026-02-10 18:00:26 +02:00

siglip.cpp

model : mtmd : make input norm optional in LFM2-VL (#18594 )

2026-01-04 18:50:02 +01:00

whisper-enc.cpp

mtmd : Adding support for Nvidia Music Flamingo Model (#18470 )

2025-12-31 12:13:23 +01:00

youtuvl.cpp

model: support youtu-vl model (#18479 )

2026-01-01 19:25:54 +01:00