← heapsort-ai

embeddings

28 items

ARTICLEDEV.to AI·il y a 1j

What I learned building a document chunking and embedding API for RAG

Cet article détaille les leçons tirées de la création d'une API de découpage et d'intégration de documents pour le RAG, soulignant le rôle essentiel du découpage dans la qualité de la récupération. Il insiste sur le fait que le découpage sensible aux phrases et le traitement spécifique des données structurées, comme les tableaux, sont cruciaux pour améliorer la récupération d'informations.

46
RESEARCH↑ trendingReddit r/MachineLearning·11/04/2026

What if your HNSW index stored 3-bit embeddings instead of float32? [R]

O texto explora uma abordagem experimental para indexação de vetores HNSW que utiliza embeddings quantizados de 3 bits, em vez de float32, para reduzir o uso de memória. A técnica, baseada em PolarQuant, permite cálculo de distância eficiente via tabelas pré-computadas, resultando em economia de memória e bom recall, apesar de um processo de construção mais lento e desafios com o ruído de quantização.

42
RESEARCHarXiv CS.CL·16/04/2026

Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction

Cet article présente un pipeline pratique pour transformer des corpus de texte en signaux sémantiques quantitatifs, en utilisant des embeddings, une évaluation basée sur les logprobs et la réduction du bruit. L'étude de cas applique six dimensions sémantiques à des articles de presse portugais sur l'IA, soutenant des tâches d'ingénierie de l'IA telles que l'inspection et le suivi de corpus.

30
ARTICLEDEV.to AI·18/04/2026

Why routing LLM calls is harder than it looks (lessons from building ai-gateway)

L'auteur décrit la complexité inattendue du routage efficace des appels LLM, ce qui l'a conduit à créer une passerelle d'IA qui décide quel modèle utiliser par requête. Ce système vise à optimiser les coûts et les performances, en dirigeant les requêtes simples vers des modèles moins chers et en utilisant des méthodes comme la similarité d'embeddings pour les décisions de routage.

28
ARTICLEDEV.to AI·09/05/2026

Vector Database Là Gì? Giải Mã "Trái Tim" Của Kỷ Nguyên AI

À l'ère florissante de l'IA et de l'apprentissage automatique, les bases de données relationnelles traditionnelles peinent à traiter les données non structurées. Les bases de données vectorielles offrent une solution spécialisée, conçue pour stocker et rechercher des intégrations vectorielles qui représentent des données non structurées dans un espace multidimensionnel, permettant des recherches de similarité très efficaces.

28
RESEARCHDEV.to AI·22/04/2026

Few-Shot Learning with Metric-Agnostic Conditional Embeddings

Cette recherche explore une nouvelle approche de l'apprentissage en un petit nombre d'exemples (few-shot learning) en introduisant des embeddings conditionnels agnostiques à la métrique. La méthode vise à améliorer l'apprentissage à partir d'un nombre limité d'échantillons de données en créant des représentations flexibles indépendantes de métriques de distance spécifiques.

27
ARTICLEDEV.to AI·15/04/2026

Building a Scalable RAG Backend with Cloud Run Jobs and AlloyDB

Ce contenu aborde le défi de la mise à l'échelle des pipelines RAG, passant de petits ensembles de données à des millions d'éléments, où la génération séquentielle d'embeddings devient un goulot d'étranglement. Il propose une solution robuste utilisant les services Google Cloud comme BigQuery, Cloud Run Jobs, Vertex AI et AlloyDB pour le traitement parallèle et le provisionnement efficace de l'infrastructure.

27
ARTICLEDEV.to AI·03/05/2026

How Pulse matches you with the right provider — semantic AI search vs keyword lookup. BizNode Pulse uses embedding-based...

BizNode Pulse utilise la recherche sémantique IA basée sur des embeddings pour mettre en relation les utilisateurs avec les bons fournisseurs, offrant une alternative supérieure à la recherche par mots-clés. Cette approche améliore la pertinence et la précision des résultats de recherche en comprenant le contexte et la signification des requêtes.

27
ARTICLEAWS Machine Learning Blog·il y a 29j

Manufacturing intelligence with Amazon Nova Multimodal Embeddings

Cet article décrit la construction d'un système de récupération multimodal pour des documents de fabrication aérospatiale, utilisant Amazon Nova Multimodal Embeddings sur Amazon Bedrock et Amazon S3 Vectors. Le système est évalué sur 26 requêtes de fabrication, comparant la qualité de génération entre un pipeline textuel et un pipeline multimodal.

27