← heapsort-ai

computer vision

125 items

RESEARCHDEV.to AI·16/04/2026

VIOLA: Imitation Learning for Vision-Based Manipulation with Object ProposalPriors

VIOLA propose une nouvelle approche pour les tâches de manipulation basées sur la vision, en utilisant l'apprentissage par imitation pour enseigner des actions complexes aux robots. Cette méthode intègre les Object ProposalPriors pour améliorer l'efficacité et la robustesse de l'apprentissage, permettant une interaction plus efficace avec les objets.

28
ARTICLEDEV.to AI·il y a 28j

ICE to Flood Streets With 1,570 Iris Scanners — Here's What It Means for You

L'ICE étend massivement l'utilisation des scanners d'iris à 1 570 unités, marquant un changement fondamental dans le traitement des données biométriques mobiles en temps réel. Cela introduit de nouveaux défis techniques pour les développeurs en vision par ordinateur et en vérification d'identité, passant de l'analyse statique à la vérification 'edge-to-cloud' à grande échelle.

28
RESEARCHarXiv CS.AI·17/04/2026

Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning

GazeX est un nouveau modèle de langage visuel entraîné sur les données de suivi oculaire et de raisonnement des radiologues pour améliorer l'interprétation des radiographies thoraciques. Le modèle apprend à émuler l'attention spatiale et temporelle des experts, visant à combler l'écart entre les sorties du modèle et le raisonnement diagnostique clinique.

27
RESEARCHDEV.to AI·21/04/2026

Improving Video-Text Retrieval by Multi-Stream Corpus Alignment and Dual SoftmaxLoss

Cette recherche propose une méthode innovante pour améliorer la récupération vidéo-texte en intégrant l'alignement de corpus multi-flux. Elle introduit également une fonction Dual SoftmaxLoss pour optimiser davantage la précision et l'efficacité de la correspondance entre le contenu vidéo et les descriptions textuelles.

27
ARTICLEDEV.to AI·22/04/2026

How AI-Powered Roof Measurement Reports are Automating the Construction Workflow via Online Aerial Roof Measurements

Ce contenu décrit comment les rapports de mesure de toiture alimentés par l'IA révolutionnent l'industrie de la construction. En utilisant des données satellitaires, la vision par ordinateur et l'apprentissage profond, ces rapports automatisent les flux de travail, améliorent la précision et créent des jumeaux numériques, remplaçant efficacement les méthodes manuelles traditionnelles.

27
RESEARCHarXiv CS.AI·13/04/2026

Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations

Cette recherche introduit l'inférence de solutions analytiques visuelles-à-symboliques (ViSA), une capacité d'IA pour récupérer des solutions analytiques de champs physiques à partir d'observations visuelles. Elle présente ViSA-R2, un pipeline auto-vérifiant imitant le raisonnement d'un physicien, et ViSA-Bench, un nouveau benchmark pour évaluer les modèles dans ce domaine.

27
ARTICLEDEV.to AI·28/04/2026

Your Face Just Cleared Customs. Who Owns It Now?

Les essais biométriques de l'IATA indiquent l'effondrement des barrières techniques pour les voyages mondiaux sans contact, progressant vers des portefeuilles d'identité numérique portables et signés cryptographiquement. Ce changement pose des défis pour la normalisation des modèles biométriques à travers différents systèmes et soulève des questions cruciales sur la propriété et la confidentialité des données.

27
CASEDEV.to AI·08/05/2026

249 Arrests, One Question: Will Croydon's Facial Recognition Cases Survive Court?

Un projet pilote de reconnaissance faciale de 13 mois à Croydon a entraîné 249 arrestations, soulevant des questions importantes sur l'intégration des systèmes de vision par ordinateur dans les processus juridiques. Le cas met en évidence l'importance d'une piste d'audit robuste et le manque de normalisation de l'industrie pour les seuils de correspondance dans les environnements de reconnaissance faciale en direct.

27
ARTICLEDEV.to AI·il y a 28j

Mobile Biometrics Hit the Street in 2026 — and the Rules Haven't Caught Up

Le système MyNIISe de Malaisie établit une nouvelle référence de traitement biométrique à 4-5 secondes, redéfinissant les exigences d'ingénierie pour la technologie d'identité. Cela déplace l'accent de la surveillance générale vers la comparaison faciale ciblée, permettant une précision de niveau entreprise même sur du matériel limité.

27
ARTICLEDEV.to AI·il y a 26j

$64 Billion Says Your Identity Verification Methods Are About to Become Obsolete

L'avenir de la vérification d'identité évolue rapidement vers la comparaison faciale passive et automatisée, avec un marché estimé à 83 milliards de dollars d'ici 2033. Ce pivot technologique signifie que les méthodes traditionnelles deviennent obsolètes, faisant de l'analyse faciale le protocole de sécurité par défaut pour les applications.

27
ARTICLEDEV.to AI·il y a 16j

Deepfake Crackdown: Feds Make First Arrests as 48-Hour Takedown Clock Goes Live

Les premières arrestations fédérales en vertu de la loi TAKE IT DOWN marquent une nouvelle phase dans la régulation des médias synthétiques, introduisant un délai critique de 48 heures pour le retrait des deepfakes. Cette exigence technique crée un goulot d'étranglement important pour les développeurs, nécessitant une vérification fiable de l'authenticité du contenu et de l'identité de la personne représentée.

27
ARTICLEDEV.to AI·il y a 22j

Why Your Image Upload Pipeline Should Check for Physically Impossible Lighting

L'article suggère de vérifier l'éclairage physiquement impossible dans les pipelines de téléchargement d'images pour détecter le contenu généré par l'IA. Les générateurs d'images IA échouent souvent à simuler avec précision la physique du monde réel, en particulier en ce qui concerne la géométrie des ombres et les sources lumineuses communes.

27
ARTICLEDEV.to AI·27/04/2026

Epismo Agent Package

L'analyse technique du package d'agents Epismo détaille une solution innovante pour créer des humains numériques alimentés par l'IA, destinés au service client, au divertissement et à l'éducation. Son architecture de microservices intègre le traitement du langage naturel, l'apprentissage automatique et la vision par ordinateur, gérés par un Cœur d'Agent et un Graphe de Connaissance.

27