← heapsort-ai

FastAPI

16 items

ARTICLEDEV.to AI·il y a 1j

Building My First AI Agent API with FastAPI and Mistral AI

Un individu sans formation technique partage son parcours de création et de déploiement de sa première API d'Agent IA, "Agentic Finance Beast", en utilisant Python, FastAPI et Mistral AI. Ce projet marque le 4ème jour de son cheminement pour devenir Ingénieur IA, avec des projets futurs incluant les systèmes RAG et la recherche financière multi-agents.

40
ARTICLEDEV.to AI·il y a 7j

I built a Zero Trust AI Architecture for Logistics (FastAPI + React). Roast my setup!

Ce billet décrit une architecture d'IA Zero Trust construite avec Google Gemini, React et FastAPI pour automatiser les chats de répartition logistique tout en atténuant les fuites de données et les hallucinations de l'IA. Le système assure l'isolement du LLM via des schémas Pydantic, inclut une intervention humaine pour les cas critiques, et désanonymise les données uniquement au niveau du backend.

28
ARTICLEDEV.to AI·13/04/2026

Building a Voice-Controlled AI Agent with FastAPI, Groq & Streamlit

Cet article décrit la création d'un agent IA à commande vocale, permettant aux utilisateurs d'interagir avec leur ordinateur pour des tâches telles que la création de fichiers ou l'écriture de code. Il couvre l'architecture du système, la sélection des modèles et un processus en trois étapes utilisant Groq Whisper pour le STT et Groq Llama-3.1-8b pour la classification des intentions, construit avec FastAPI et Streamlit.

28
DOCDEV.to AI·il y a 25j

How to Deploy Llama 3.2 1B with TinyLLM + FastAPI on a $5/Month DigitalOcean Droplet: Sub-100ms Latency Inference at 1/250th Claude Cost

Le contenu explique comment déployer Llama 3.2 1B avec TinyLLM et FastAPI sur un Droplet DigitalOcean à 5 $/mois, atteignant une inférence avec une latence inférieure à 100 ms. Cette configuration permet une inférence d'IA en temps réel de qualité production, réduisant considérablement les coûts et évitant le verrouillage fournisseur.

27
ARTICLEDEV.to AI·10/05/2026

AI-Powered Semantic Job Matching System Using FastAPI, Vector Databases, and Dual Encoders

JobSync est un système de correspondance d'emplois sémantique basé sur l'IA qui dépasse la simple correspondance par mots-clés en utilisant des plongements vectoriels et des encodeurs doubles pour comprendre le sens. Conçu avec FastAPI et Qdrant, il connecte efficacement les candidats aux postes en reconnaissant des concepts étroitement liés.

27
CASEDEV.to AI·il y a 12j

Human-in-the-Loop AI Workflow Automation with Make, FastAPI, OpenAI, and Monday CRM

Le contenu décrit une architecture pour l'automatisation de flux de travail d'IA avec intervention humaine, intégrant Make.com, FastAPI, OpenAI et Monday CRM. L'objectif est de gérer les défis de production tels que les erreurs d'IA et les validations humaines, en réduisant les tâches de révision manuelle répétitives de manière contrôlée et traçable.

27
ARTICLEDEV.to AI·24/04/2026

A QA engineer's first AI testing project - FastAPI + local LLM + pytest

Un ingénieur en automatisation partage son premier projet de test d'IA, en construisant un service FastAPI avec un LLM local (Ollama/llama3.2) et une suite pytest, suite à une offre d'emploi. L'objectif était de comprendre les nuances des tests d'IA/LLM par rapport aux tests UI/API traditionnels, le succès initial de la suite rendant l'expérience d'apprentissage difficile.

26