RESEARCH28
Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification
arXiv CS.CL·21 mai 2026
Cette recherche examine comment différents niveaux de quantification à faible bit affectent les performances de LLaMA-3.1 en analyse qualitative, notant que les modèles à faible bit produisent souvent des hallucinations. Elle propose une méthode de vérification de prompt multipasse sensible à la quantification pour améliorer la précision en réduisant systématiquement les hallucinations et en filtrant le contenu non fiable.
Lire l'original ↗