2b or not 2b ? Custom LLM Scheduling Competition [P]
Foi lançada uma competição no Kaggle focada em otimizar o custo de tokens para respostas de LLMs, desafiando os participantes a decidir entre usar um modelo pequeno ou pular a pergunta. O objetivo é minimizar o custo ponderado, considerando os custos de computação, falha e pular uma resposta correta.
