llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-08-15 04:33:06 -04:00

Files

compilade e54d41befc gguf-py : add Numpy MXFP4 de/quantization support (#15111 )

* gguf-py : add MXFP4 de/quantization support

* ggml-quants : handle zero amax for MXFP4

2025-08-08 17:48:26 -04:00

2025-08-04 21:01:48 +02:00

__init__.py

2024-07-18 20:40:15 +10:00

constants.py

2025-08-05 22:10:36 +03:00

gguf_reader.py

2025-05-21 16:33:54 +02:00

gguf_writer.py

2025-08-05 22:10:36 +03:00

gguf.py

…

lazy.py

2025-04-08 09:03:07 +02:00

metadata.py

2025-07-22 19:29:43 +03:00

py.typed

…

quants.py

2025-08-08 17:48:26 -04:00

tensor_mapping.py

2025-08-07 18:20:40 +02:00

utility.py

2025-05-28 23:50:20 +02:00

vocab.py

2025-08-03 16:56:25 +02:00