← heapsort-ai

prompt engineering

255 items

DOCDEV.to AI·4/26/2026

The Developer's Guide to Finetuning LLMs

"The Developer's Guide to Finetuning LLMs" provides a practical guide for developers and retail leaders on when, why, and how to finetune LLMs. It covers decision frameworks, costs, data preparation, and evaluation strategies, comparing finetuning with prompt engineering and RAG for brand-specific tasks.

27
RESEARCHarXiv CS.CL·4/8/2026

This Treatment Works, Right? Evaluating LLM Sensitivity to Patient Question Framing in Medical QA

Este estudo de pesquisa avalia a sensibilidade de Grandes Modelos de Linguagem (LLMs) à forma como as perguntas de pacientes são formuladas em cenários de QA médica. Usando um ambiente RAG controlado, a pesquisa investiga como o enquadramento (positivo vs. negativo) e o estilo da linguagem afetam a consistência das respostas dos LLMs.

27
RESEARCHarXiv CS.CL·4/6/2026

Failing to Falsify: Evaluating and Mitigating Confirmation Bias in Language Models

Este estudo investiga o viés de confirmação em grandes modelos de linguagem (LLMs) usando uma tarefa de descoberta de regras, revelando que os LLMs exibem essa tendência, o que retarda a descoberta de regras ocultas. Ele demonstra que estratégias de intervenção, como o uso de prompts específicos, podem consistentemente diminuir esse viés.

27