Large Language Models (LLMs)

3 items

RESEARCHarXiv CS.CL·15/4/2026

Robust Explanations for User Trust in Enterprise NLP Systems

Esta investigación propone un marco unificado de evaluación de la robustez de caja negra para explicaciones a nivel de token, con el fin de mejorar la confianza del usuario en los sistemas NLP empresariales, especialmente al migrar a LLMs. El estudio operacionaliza la robustez mediante la tasa de cambio de tokens principales bajo perturbaciones realistas, comparando arquitecturas de codificador y decodificador como BERT, RoBERTa, Qwen y Llama.

model robustness Explainable AI (XAI)User Trust Large Language Models (LLMs)

ARTICLEDEV.to AI·19/4/2026

Gemma-4 Deployment Woes, `easyaligner` for Audio, & Claude Enterprise Privacy

Este contenido aborda los desafíos prácticos en la implementación del modelo Gemma-4 de Google, presenta una nueva herramienta de código abierto para la alineación de voz a texto y discute consideraciones críticas de privacidad de datos para usuarios de Claude Enterprise.

Open Source MLOps data privacy Large Language Models (LLMs)

RESEARCHarXiv CS.CL·27/4/2026

Outcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning

Este artículo investiga si las recompensas de resultado en el aprendizaje por refuerzo para cadenas de pensamiento garantizan un razonamiento verificable o causalmente importante en los LLM. Introduciendo las métricas CIR y SR, los autores encuentran que, si bien el RLVR mejora la precisión, no mejora de forma fiable el CIR o el SR, y una pequeña cantidad de SFT puede remediar estos problemas.

reinforcement learning AI training Large Language Models (LLMs)Model Evaluation