← heapsort-ai

Llama-2

11 items

RESEARCHarXiv CS.CL·hace 20h

Evaluating Hallucinations in Domain-Adapted Large Language Models

Este estudio investiga las alucinaciones en Grandes Modelos de Lenguaje adaptados a dominios, centrándose en Llama-2 ajustado con el conjunto de datos Lamini. Se encontró que su capacidad para razonar y recordar nueva información específica del dominio es limitada, lo que lleva a instancias de alucinación y una tendencia a la sobregeneración.

55
DOCDEV.to AI·hace 4d

How to Deploy Llama 2 on DigitalOcean for $5/Month

Esta guía detalla cómo autoalojar Llama 2 en un Droplet de DigitalOcean por $5/mes, permitiendo inferencia de IA rentable para más de 50 solicitudes de API diarias con tiempos de respuesta de menos de un segundo. Cubre el despliegue listo para producción con cuantificación, almacenamiento en caché y monitoreo, ofreciendo una alternativa más económica a las costosas API de IA.

28
DOCDEV.to AI·hace 7d

How to Self-Host Llama 2 on a $5/month DigitalOcean Droplet

Esta guía detalla cómo autoalojar Llama 2 en un Droplet de DigitalOcean de $5/mes, ofreciendo un ahorro significativo de costos en comparación con las API de IA gestionadas para usuarios que realizan más de 100 llamadas de inferencia diarias. Proporciona una configuración completa para un servidor de inferencia funcional, incluyendo puntos finales de API y monitoreo.

27
DOCDEV.to AI·hace 9d

How to Deploy Llama 2 on DigitalOcean for $5/month: Complete Self-Hosting Guide

Esta guía detalla cómo implementar un servidor de inferencia Llama 2 de grado de producción en DigitalOcean por solo $5 al mes, ofreciendo una alternativa rentable a las API de IA. La solución de autoalojamiento está diseñada para funcionar 24/7 con latencia sub-segundo, ideal para inferencia a escala sin impuestos excesivos de proveedores de la nube.

27