heapsort
RESEARCH28

Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification

arXiv CS.CL·21 de mayo de 2026

Esta investigación examina cómo varios niveles de cuantificación de bits bajos afectan el rendimiento de LLaMA-3.1 en el análisis cualitativo, señalando que los modelos de bajo bit a menudo producen alucinaciones. Propone un método de verificación de prompt multipaso consciente de la cuantificación para mejorar la precisión reduciendo sistemáticamente las alucinaciones y filtrando contenido poco fiable.

Leer original