RESEARCHarXiv CS.LG·hace 26d
Towards the Next Frontier of LLMs, Training on Private Data: A Cross-Domain Benchmark for Federated Fine-Tuning
El artículo aborda el desafío de entrenar grandes modelos de lenguaje (LLMs) con datos privados y distribuidos, especialmente en sectores regulados como la salud y las finanzas. Propone un enfoque práctico para aprovechar estos datos valiosos, pero no compartibles y no-IID, con el objetivo de dotar a los LLMs de una experiencia de dominio más profunda.
27