Remove Q4_3 which is no better than Q5 (#1218)

2025-06-27 12:05:03 +00:00 · 2023-04-28 23:10:43 +00:00
parent 7f15c5c477
commit 36d19a603b
11 changed files with 21 additions and 359 deletions
--- a/ggml-cuda.h
+++ b/ggml-cuda.h
@ -34,7 +34,6 @@ void   ggml_cuda_pool_free(void * ptr, size_t size);
 void dequantize_row_q4_0_cuda(const void * vx, float * y, int k, cudaStream_t stream);
 void dequantize_row_q4_1_cuda(const void * vx, float * y, int k, cudaStream_t stream);
 void dequantize_row_q4_2_cuda(const void * vx, float * y, int k, cudaStream_t stream);
-void dequantize_row_q4_3_cuda(const void * vx, float * y, int k, cudaStream_t stream);
 void dequantize_row_q5_0_cuda(const void * vx, float * y, int k, cudaStream_t stream);
 void dequantize_row_q5_1_cuda(const void * vx, float * y, int k, cudaStream_t stream);
 void dequantize_row_q8_0_cuda(const void * vx, float * y, int k, cudaStream_t stream);