llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2026-06-29 15:50:22 +00:00

Files

T

compilade e54d41befc gguf-py : add Numpy MXFP4 de/quantization support (#15111 )

* gguf-py : add MXFP4 de/quantization support

* ggml-quants : handle zero amax for MXFP4

2025-08-08 17:48:26 -04:00

__init__.py

2024-07-18 20:40:15 +10:00

test_metadata.py

2024-11-13 21:10:38 +11:00

test_quants.py

2025-08-08 17:48:26 -04:00