← heapsort-ai

Information Retrieval

36 items

ARTICLEDEV.to AI·3/5/2026

How Pulse matches you with the right provider — semantic AI search vs keyword lookup. BizNode Pulse uses embedding-based...

BizNode Pulse emplea la búsqueda de IA semántica basada en embeddings para emparejar a los usuarios con los proveedores adecuados, ofreciendo una alternativa superior a la búsqueda tradicional por palabras clave. Este enfoque mejora la relevancia y precisión de los resultados de búsqueda al comprender el contexto y el significado detrás de las consultas.

27
RESEARCHarXiv CS.AI·27/4/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto presenta una capa de memoria universal para agentes de IA autónomos, abordando el cuello de botella arquitectónico de la memoria en sistemas persistentes de múltiples sesiones. Desafía la necesidad de grafos de conocimiento complejos al proponer un esquema de memoria semántica tipada más simple con resolución automatizada de conflictos y versionado temporal.

27
RESEARCHarXiv CS.CL·8/4/2026

Document Optimization for Black-Box Retrieval via Reinforcement Learning

Este artigo de pesquisa propõe uma nova abordagem para otimização de documentos, transformando-os para melhor alinhamento com sistemas de recuperação via Reinforcement Learning (GRPO), utilizando melhorias de ranking como recompensa. O método, aplicável a retrievers de caixa preta, demonstrou ganhos em tarefas de recuperação de código e documentos visuais.

27
RESEARCHarXiv CS.CL·8/5/2026

Generating Query-Focused Summarization Datasets from Query-Free Summarization Datasets

Este artículo propone un modelo basado en evidencia para generar consultas a partir de conjuntos de datos de resumen sin consulta, abordando la escasez de datos para la Sumarización Enfocada en Consultas (QFS). Los resultados experimentales indican que los resúmenes generados con estas consultas basadas en evidencia logran puntuaciones ROUGE competitivas, demostrando su eficacia para la tarea de QFS.

27
RESEARCHarXiv CS.AI·hace 24d

PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts

El artículo presenta PolitNuggets, un benchmark multilingüe para la síntesis de información agéntica, centrado en la construcción de biografías políticas para 400 élites globales. Evalúa grandes modelos de razonamiento en el descubrimiento y la síntesis de hechos políticos de "cola larga", destacando desafíos en detalles finos y eficiencia.

27
RESEARCHarXiv CS.CL·hace 29d

Can LLMs Take Retrieved Information with a Grain of Salt?

Este artículo evalúa la capacidad de los grandes modelos de lenguaje (LLMs) para adaptar sus respuestas a la certeza de la información recuperada, revelando limitaciones sistemáticas. Propone una estrategia de interacción que combina recordatorios previos, recalibración de certeza y simplificación de contexto para mejorar la fiabilidad de los LLMs. Este enfoque reduce los errores de obediencia en un 25% sin modificar los pesos del modelo.

27
RESEARCHarXiv CS.CL·hace 29d

Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries

Este artículo presenta Group of Skills (GoSkills), un método de recuperación de habilidades estructuradas en grupos para bibliotecas de habilidades de agentes de IA. Transforma listas de habilidades planas en contextos de ejecución compactos y con etiquetas de rol, construyendo grupos de habilidades centrados en anclas y proporcionando un contrato de ejecución fijo con campos de Inicio, Soporte y Verificación.

27
RESEARCHarXiv CS.CL·hace 15d

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Este artículo presenta el Query-Adaptive Semantic Chunking (QASC), una estrategia dinámica para sistemas de Generación Aumentada por Recuperación (RAG) que integra consultas de usuario en la segmentación de documentos. QASC utiliza la puntuación de similitud de coseno, la expansión de ventanas contextuales y la agregación de puntuaciones a nivel de fragmento para optimizar la recuperación de contexto, superando las limitaciones de los métodos de fragmentación fija.

27
ARTICLEHugging Face Blog·hace 22d

Introducing the Ettin Reranker Family

Este artículo presenta la familia de rerankers Ettin, un nuevo conjunto de modelos diseñados para mejorar la relevancia y la calidad de los resultados en sistemas de búsqueda y recomendación. Los modelos Ettin buscan optimizar la clasificación de documentos, ofreciendo un rendimiento superior en tareas de recuperación de información.

27
ARTICLEDEV.to AI·26/4/2026

Bilibili Tech Video Search Through MCP

Este contenido explica cómo los agentes de IA pueden integrar Bilibili en flujos de trabajo de investigación técnica a través de AutoSearch, utilizando su contenido de video único para temas como demostraciones y comportamientos de interfaz de usuario. Resalta el valor de Bilibili para complementar las fuentes tradicionales basadas en texto, especialmente para acceder a información de las comunidades de desarrolladores chinos.

21
ARTICLEOpenAI Blog·10/4/2026

Research with ChatGPT

Este contenido enseña cómo investigar eficazmente con ChatGPT, utilizando búsqueda y investigación profunda. Cubre la localización de información actualizada, el análisis de fuentes y la generación de conocimientos estructurados.

21