Information Retrieval

36 items

ARTICLEDEV.to AI·3/5/2026

How Pulse matches you with the right provider — semantic AI search vs keyword lookup. BizNode Pulse uses embedding-based...

BizNode Pulse emplea la búsqueda de IA semántica basada en embeddings para emparejar a los usuarios con los proveedores adecuados, ofreciendo una alternativa superior a la búsqueda tradicional por palabras clave. Este enfoque mejora la relevancia y precisión de los resultados de búsqueda al comprender el contexto y el significado detrás de las consultas.

provider matching semantic search embeddings AI

RESEARCHarXiv CS.AI·27/4/2026

Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

Memanto presenta una capa de memoria universal para agentes de IA autónomos, abordando el cuello de botella arquitectónico de la memoria en sistemas persistentes de múltiples sesiones. Desafía la necesidad de grafos de conocimiento complejos al proponer un esquema de memoria semántica tipada más simple con resolución automatizada de conflictos y versionado temporal.

Knowledge Graphs Semantic Memory memory management Information Retrieval

RESEARCHDEV.to AI·8/4/2026

Neural Models for Information Retrieval

Este conteúdo aborda o uso de modelos neurais para aprimorar os sistemas de recuperação de informação. Explora como a inteligência artificial pode otimizar a busca e organização de grandes volumes de dados.

neural networks deep learning machine learning Information Retrieval

RESEARCHarXiv CS.CL·8/4/2026

Document Optimization for Black-Box Retrieval via Reinforcement Learning

Este artigo de pesquisa propõe uma nova abordagem para otimização de documentos, transformando-os para melhor alinhamento com sistemas de recuperação via Reinforcement Learning (GRPO), utilizando melhorias de ranking como recompensa. O método, aplicável a retrievers de caixa preta, demonstrou ganhos em tarefas de recuperação de código e documentos visuais.

language models Vision-Language Models reinforcement learning document optimization

RESEARCHarXiv CS.CL·8/5/2026

Generating Query-Focused Summarization Datasets from Query-Free Summarization Datasets

Este artículo propone un modelo basado en evidencia para generar consultas a partir de conjuntos de datos de resumen sin consulta, abordando la escasez de datos para la Sumarización Enfocada en Consultas (QFS). Los resultados experimentales indican que los resúmenes generados con estas consultas basadas en evidencia logran puntuaciones ROUGE competitivas, demostrando su eficacia para la tarea de QFS.

query generation Natural Language Processing datasets summarization

RESEARCHarXiv CS.AI·hace 24d

PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts

El artículo presenta PolitNuggets, un benchmark multilingüe para la síntesis de información agéntica, centrado en la construcción de biografías políticas para 400 élites globales. Evalúa grandes modelos de razonamiento en el descubrimiento y la síntesis de hechos políticos de "cola larga", destacando desafíos en detalles finos y eficiencia.

political facts Benchmarking Information Retrieval AI agents

RESEARCHarXiv CS.CL·hace 29d

Can LLMs Take Retrieved Information with a Grain of Salt?

Este artículo evalúa la capacidad de los grandes modelos de lenguaje (LLMs) para adaptar sus respuestas a la certeza de la información recuperada, revelando limitaciones sistemáticas. Propone una estrategia de interacción que combina recordatorios previos, recalibración de certeza y simplificación de contexto para mejorar la fiabilidad de los LLMs. Este enfoque reduce los errores de obediencia en un 25% sin modificar los pesos del modelo.

LLMs context certainty Natural Language Processing AI reliability

RESEARCHarXiv CS.CL·hace 29d

Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries

Este artículo presenta Group of Skills (GoSkills), un método de recuperación de habilidades estructuradas en grupos para bibliotecas de habilidades de agentes de IA. Transforma listas de habilidades planas en contextos de ejecución compactos y con etiquetas de rol, construyendo grupos de habilidades centrados en anclas y proporcionando un contrato de ejecución fijo con campos de Inicio, Soporte y Verificación.

Skill Retrieval machine learning Information Retrieval AI agents

RESEARCHarXiv CS.CL·hace 15d

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

Este artículo presenta el Query-Adaptive Semantic Chunking (QASC), una estrategia dinámica para sistemas de Generación Aumentada por Recuperación (RAG) que integra consultas de usuario en la segmentación de documentos. QASC utiliza la puntuación de similitud de coseno, la expansión de ventanas contextuales y la agregación de puntuaciones a nivel de fragmento para optimizar la recuperación de contexto, superando las limitaciones de los métodos de fragmentación fija.

RAG Natural Language Processing Information Retrieval Semantic Chunking

ARTICLEHugging Face Blog·hace 22d

Introducing the Ettin Reranker Family

Este artículo presenta la familia de rerankers Ettin, un nuevo conjunto de modelos diseñados para mejorar la relevancia y la calidad de los resultados en sistemas de búsqueda y recomendación. Los modelos Ettin buscan optimizar la clasificación de documentos, ofreciendo un rendimiento superior en tareas de recuperación de información.

AI models machine learning Reranking Information Retrieval

ARTICLEYannic Kilcher (YouTube)·11/10/2025

[Paper Analysis] On the Theoretical Limitations of Embedding-Based Retrieval (Warning: Rant)

Este artículo analiza las limitaciones teóricas de los sistemas de recuperación basados en incrustaciones. El autor expresa una perspectiva crítica sobre el tema.

machine learning embeddings AI theoretical limitations

[Paper Analysis] On the Theoretical Limitations of Embedding-Based Retrieval (Warning: Rant)

ARTICLEDEV.to AI·26/4/2026

Tagging, Folksonomy & Co - Renaissance of Manual Indexing?

Este artículo explora los conceptos de etiquetado, folksonomía e indexación manual, cuestionando si existe una importancia renovada para los métodos de clasificación de datos impulsados por humanos. Probablemente analiza su papel en una era cada vez más dominada por la IA y la organización automatizada de contenido.

Data Organization manual-indexing Information Retrieval folksonomy

ARTICLEDEV.to AI·26/4/2026

Bilibili Tech Video Search Through MCP

Este contenido explica cómo los agentes de IA pueden integrar Bilibili en flujos de trabajo de investigación técnica a través de AutoSearch, utilizando su contenido de video único para temas como demostraciones y comportamientos de interfaz de usuario. Resalta el valor de Bilibili para complementar las fuentes tradicionales basadas en texto, especialmente para acceder a información de las comunidades de desarrolladores chinos.

video content Chinese tech Information Retrieval technical research

ARTICLEDEV.to AI·26/4/2026

Zhihu Deep Knowledge Search for Agents

Zhihu se analiza como una fuente valiosa para agentes de IA en investigación profunda en chino, ofreciendo explicaciones y contexto detallados. Los flujos de trabajo de los agentes deben considerar su calidad variable, aprovechando sus fortalezas para el razonamiento a largo plazo.

LLMs research Information Retrieval AI agents

ARTICLEOpenAI Blog·10/4/2026

Research with ChatGPT

Este contenido enseña cómo investigar eficazmente con ChatGPT, utilizando búsqueda y investigación profunda. Cubre la localización de información actualizada, el análisis de fuentes y la generación de conocimientos estructurados.

research ChatGPT data analysis AI tools

ARTICLEDEV.to AI·hace 4d

Graph-Based vs Traditional Enterprise Search: Pros and Cons

Este artículo compara los métodos de búsqueda empresarial tradicionales y basados en grafos, analizando sus pros y sus contras. La búsqueda tradicional se basa en la coincidencia de palabras clave, mientras que la búsqueda basada en grafos utiliza el procesamiento orientado a las relaciones para un contexto y una escalabilidad mejorados.

graph technology data management Enterprise Search Information Retrieval