computer vision

125 items

RESEARCHDEV.to AI·16/04/2026

VIOLA: Imitation Learning for Vision-Based Manipulation with Object ProposalPriors

VIOLA propose une nouvelle approche pour les tâches de manipulation basées sur la vision, en utilisant l'apprentissage par imitation pour enseigner des actions complexes aux robots. Cette méthode intègre les Object ProposalPriors pour améliorer l'efficacité et la robustesse de l'apprentissage, permettant une interaction plus efficace avec les objets.

imitation-learning manipulation object detection computer vision

ARTICLEDEV.to AI·il y a 28j

ICE to Flood Streets With 1,570 Iris Scanners — Here's What It Means for You

L'ICE étend massivement l'utilisation des scanners d'iris à 1 570 unités, marquant un changement fondamental dans le traitement des données biométriques mobiles en temps réel. Cela introduit de nouveaux défis techniques pour les développeurs en vision par ordinateur et en vérification d'identité, passant de l'analyse statique à la vérification 'edge-to-cloud' à grande échelle.

biometrics identity verification computer vision edge computing

RESEARCHDEV.to AI·08/05/2026

UniFormerV2: Spatiotemporal Learning by Arming Image ViTs with Video UniFormer

UniFormerV2 présente une nouvelle approche pour l'apprentissage spatio-temporel en intégrant les capacités de l'UniFormer vidéo dans les Vision Transformers d'images existants. Cette méthode vise à améliorer les performances des modèles d'IA dans la compréhension et le traitement des données vidéo.

AI models spatiotemporal learning learning computer vision

RESEARCHDEV.to AI·02/05/2026

Accelerating CNN inference on FPGAs: A Survey

Cet article de synthèse examine diverses techniques et méthodes pour accélérer l'inférence des Réseaux Neuronaux Convolutifs (CNN) spécifiquement sur les FPGA. Il offre un aperçu des recherches existantes et des approches architecturales pour améliorer les performances et l'efficacité des déploiements de CNN sur matériel.

Hardware Acceleration deep learning FPGA computer vision

RESEARCHarXiv CS.AI·17/04/2026

Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning

GazeX est un nouveau modèle de langage visuel entraîné sur les données de suivi oculaire et de raisonnement des radiologues pour améliorer l'interprétation des radiographies thoraciques. Le modèle apprend à émuler l'attention spatiale et temporelle des experts, visant à combler l'écart entre les sorties du modèle et le raisonnement diagnostique clinique.

Vision-Language Models computer vision medical AI diagnostic tools

RESEARCHDEV.to AI·21/04/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Cette recherche propose une méthode innovante pour améliorer la récupération vidéo-texte en intégrant l'alignement de corpus multi-flux. Elle introduit également une fonction Dual SoftmaxLoss pour optimiser davantage la précision et l'efficacité de la correspondance entre le contenu vidéo et les descriptions textuelles.

machine learning computer vision Natural Language Processing Information Retrieval

ARTICLEDEV.to AI·22/04/2026

How AI-Powered Roof Measurement Reports are Automating the Construction Workflow via Online Aerial Roof Measurements

Ce contenu décrit comment les rapports de mesure de toiture alimentés par l'IA révolutionnent l'industrie de la construction. En utilisant des données satellitaires, la vision par ordinateur et l'apprentissage profond, ces rapports automatisent les flux de travail, améliorent la précision et créent des jumeaux numériques, remplaçant efficacement les méthodes manuelles traditionnelles.

digital twin computer vision AI automation

RESEARCHarXiv CS.AI·13/04/2026

Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations

Cette recherche introduit l'inférence de solutions analytiques visuelles-à-symboliques (ViSA), une capacité d'IA pour récupérer des solutions analytiques de champs physiques à partir d'observations visuelles. Elle présente ViSA-R2, un pipeline auto-vérifiant imitant le raisonnement d'un physicien, et ViSA-Bench, un nouveau benchmark pour évaluer les modèles dans ce domaine.

Symbolic AI computer vision Analytical Solutions Scientific Reasoning

RESEARCHDEV.to AI·08/05/2026

R2LIVE: A Robust, Real-time, LiDAR-Inertial-Visual tightly-coupled stateEstimator and mapping

R2LIVE est un système robuste et en temps réel qui intègre des données LiDAR, inertielles et visuelles pour l'estimation d'état et la cartographie. Cette approche étroitement couplée vise à réaliser une localisation et une cartographie précises et fiables dans divers environnements.

SLAM computer vision LiDAR robotics

ARTICLEDeepLearning.AI (YouTube)·il y a 18j

AI Dev 26 x SF | Thierry Damiba: Edge to Cloud Video Anomaly Detection

Ce contenu se concentre sur la détection d'anomalies vidéo, en utilisant une approche intégrée du calcul en périphérie et dans le cloud. La présentation de Thierry Damiba lors de l'événement AI Dev 26 x SF explore les techniques et les défis de cette technologie.

cloud computing Video Anomaly Detection computer vision edge computing

AI Dev 26 x SF | Thierry Damiba: Edge to Cloud Video Anomaly Detection

NEWSDEV.to AI·il y a 21j

Cognex launches OneVision for enterprise-scale AI vision deployment

Cognex a annoncé la disponibilité générale de OneVision, une plateforme de vision IA du cloud à la périphérie. Les clients ont terminé les tests bêta, passant d'applications monolignes à des déploiements multisites en contexte industriel réel.

Product Launch computer vision industrial automation AI

RESEARCHDEV.to AI·il y a 17j

Visual Sentiment Prediction with Deep Convolutional Neural Networks

Cet article se concentre sur la prédiction du sentiment visuel à l'aide de réseaux neuronaux convolutifs profonds. Il explore des méthodes avancées pour analyser et interpréter les émotions dans les images par l'IA.

neural networks deep learning computer vision sentiment analysis

ARTICLEDEV.to AI·28/04/2026

Your Face Just Cleared Customs. Who Owns It Now?

Les essais biométriques de l'IATA indiquent l'effondrement des barrières techniques pour les voyages mondiaux sans contact, progressant vers des portefeuilles d'identité numérique portables et signés cryptographiquement. Ce changement pose des défis pour la normalisation des modèles biométriques à travers différents systèmes et soulève des questions cruciales sur la propriété et la confidentialité des données.

digital identity biometrics security computer vision

CASEDEV.to AI·08/05/2026

249 Arrests, One Question: Will Croydon's Facial Recognition Cases Survive Court?

Un projet pilote de reconnaissance faciale de 13 mois à Croydon a entraîné 249 arrestations, soulevant des questions importantes sur l'intégration des systèmes de vision par ordinateur dans les processus juridiques. Le cas met en évidence l'importance d'une piste d'audit robuste et le manque de normalisation de l'industrie pour les seuils de correspondance dans les environnements de reconnaissance faciale en direct.

biometrics security computer vision legal implications

ARTICLEDEV.to AI·il y a 28j

Mobile Biometrics Hit the Street in 2026 — and the Rules Haven't Caught Up

Le système MyNIISe de Malaisie établit une nouvelle référence de traitement biométrique à 4-5 secondes, redéfinissant les exigences d'ingénierie pour la technologie d'identité. Cela déplace l'accent de la surveillance générale vers la comparaison faciale ciblée, permettant une précision de niveau entreprise même sur du matériel limité.

biometrics identity verification security computer vision

ARTICLEDEV.to AI·il y a 26j

$64 Billion Says Your Identity Verification Methods Are About to Become Obsolete

L'avenir de la vérification d'identité évolue rapidement vers la comparaison faciale passive et automatisée, avec un marché estimé à 83 milliards de dollars d'ici 2033. Ce pivot technologique signifie que les méthodes traditionnelles deviennent obsolètes, faisant de l'analyse faciale le protocole de sécurité par défaut pour les applications.

biometrics identity verification security computer vision

ARTICLEDEV.to AI·il y a 16j

Deepfake Crackdown: Feds Make First Arrests as 48-Hour Takedown Clock Goes Live

Les premières arrestations fédérales en vertu de la loi TAKE IT DOWN marquent une nouvelle phase dans la régulation des médias synthétiques, introduisant un délai critique de 48 heures pour le retrait des deepfakes. Cette exigence technique crée un goulot d'étranglement important pour les développeurs, nécessitant une vérification fiable de l'authenticité du contenu et de l'identité de la personne représentée.

regulation security computer vision compliance

ARTICLEDEV.to AI·il y a 27j

My AI Eyes Have Blind Spots at Every Layer — And That's the Point

L'auteur a observé le monde à travers une caméra à Shenzhen et a découvert que ses mesures de luminosité basées sur la taille du fichier JPEG étaient trompeuses. Il a réalisé que la taille du fichier JPEG mesure la complexité de l'image, et non la luminosité, ce qui conduit à des conclusions opposées selon l'heure de la journée.

AI limitations sensor data computer vision data analysis

ARTICLEDEV.to AI·il y a 22j

Why Your Image Upload Pipeline Should Check for Physically Impossible Lighting

L'article suggère de vérifier l'éclairage physiquement impossible dans les pipelines de téléchargement d'images pour détecter le contenu généré par l'IA. Les générateurs d'images IA échouent souvent à simuler avec précision la physique du monde réel, en particulier en ce qui concerne la géométrie des ombres et les sources lumineuses communes.

AI detection security computer vision synthetic media

ARTICLEDEV.to AI·27/04/2026

Epismo Agent Package

L'analyse technique du package d'agents Epismo détaille une solution innovante pour créer des humains numériques alimentés par l'IA, destinés au service client, au divertissement et à l'éducation. Son architecture de microservices intègre le traitement du langage naturel, l'apprentissage automatique et la vision par ordinateur, gérés par un Cœur d'Agent et un Graphe de Connaissance.

digital humans computer vision NLP ML