llama.cpp

mirror of https://github.com/ggml-org/llama.cpp.git synced 2025-07-20 09:37:40 +00:00

Files

Stephan Walter 69c92298a9 Deduplicate q4 quantization functions (#383 )

* Deduplicate q4 quantization functions

* Use const; add basic test

* Re-enable quantization test

* Disable AVX2 flags in CI

---------

Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

2023-03-22 19:29:06 +02:00

CMakeLists.txt

Deduplicate q4 quantization functions (#383 )

2023-03-22 19:29:06 +02:00

test-quantize.c

Deduplicate q4 quantization functions (#383 )

2023-03-22 19:29:06 +02:00

test-tokenizer-0.cpp

Introduce C-style API (#370 )

2023-03-22 07:32:36 +02:00