computer vision

125 items

RESEARCHDEV.to AI·9/4/2026

Charades-Ego: A Large-Scale Dataset of Paired Third and First Person Videos

Charades-Ego es un conjunto de datos a gran escala que presenta videos emparejados en tercera y primera persona. Este recurso es valioso para la investigación en visión por computadora y análisis de video.

Dataset First-person vision Third-person vision computer vision

ARTICLETwo Minute Papers (YouTube)·28/4/2026

Solved: The Bug That Haunted AI Video For Years

Un error persistente que afectó la tecnología de video con IA durante años ha sido finalmente resuelto. Esta solución representa un avance significativo para la calidad y estabilidad de los sistemas de video basados en inteligencia artificial.

AI video deep learning computer vision bug fix

Solved: The Bug That Haunted AI Video For Years

NEWSQwen Blog·18/8/2025

Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency

Qwen-Image-Edit é uma nova versão do modelo Qwen-Image focada em edição de imagens, estendendo suas capacidades de renderização de texto para edição precisa. Ele permite edição semântica e de aparência ao integrar-se com Qwen2.5-VL e VAE Encoder.

text-editing computer vision Image Editing AI Model

RESEARCHGoogle DeepMind Blog·16/1/2026

D4RT: Teaching AI to see the world in four dimensions

D4RT é uma tecnologia que ensina a IA a perceber o mundo em quatro dimensões. Ela oferece reconstrução e rastreamento 4D unificados e eficientes, sendo até 300 vezes mais rápida que métodos anteriores.

tracking 4D Reconstruction efficiency computer vision

ARTICLEAI at Meta (YouTube)·20/11/2025

SAM 3: Under the hood of the data engine | AI at Meta

Este artículo profundiza en las complejidades técnicas de SAM 3, explorando la arquitectura y el funcionamiento de su motor de datos subyacente. Ofrece una mirada en profundidad a cómo el sistema de IA de Meta procesa y utiliza datos para capacidades avanzadas.

AI models data engine Segmentation Meta AI

SAM 3: Under the hood of the data engine | AI at Meta

NEWSAI at Meta (YouTube)·19/11/2025

Introducing Meta Segment Anything Model 3 (SAM 3): Unified Detection, Segmentation & Tracking

Meta presenta el Segment Anything Model 3 (SAM 3), una evolución que unifica detección, segmentación y seguimiento. Esta nueva versión promete avances significativos en el campo de la visión por computadora.

AI models tracking Segmentation computer vision

Introducing Meta Segment Anything Model 3 (SAM 3): Unified Detection, Segmentation & Tracking

NEWSAI at Meta (YouTube)·19/11/2025

Introducing SAM 3D: a New Standard for 3D Object & Human Reconstruction from a Single Image

Se ha presentado SAM 3D, un nuevo estándar para la reconstrucción 3D de objetos y humanos a partir de una sola imagen. Esta tecnología representa un avance significativo en el campo de la visión por computador y el modelado 3D.

AI models 3D reconstruction single image computer vision

Introducing SAM 3D: a New Standard for 3D Object & Human Reconstruction from a Single Image

DOCWeights & Biases·5/12/2019

Walking through Neural Style Transfer with Weights & Biases

Este contenido ofrece un tutorial práctico sobre la Transferencia de Estilo Neuronal, detallando cómo implementar esta técnica. Explora el uso de la biblioteca Weights & Biases para monitorear y gestionar experimentos de aprendizaje automático. La guía es ideal para quienes buscan aprender a aplicar la estilización artística en imágenes.

neural style transfer deep learning learning computer vision

RESEARCHAI at Meta (YouTube)·8/12/2025

SAM 3: Building a unified model architecture for detection and tracking

SAM 3 se centra en la construcción de una arquitectura de modelo unificada para tareas de detección y seguimiento. Su objetivo es mejorar la eficiencia y la precisión en aplicaciones de visión por computadora.

Model Architecture object detection machine learning computer vision

SAM 3: Building a unified model architecture for detection and tracking

ARTICLEAI at Meta (YouTube)·21/11/2025

Introducing the Segment Anything Playground | AI at Meta

Meta ha presentado el Segment Anything Playground, una nueva plataforma diseñada para explorar y utilizar el Segment Anything Model (SAM). Esta iniciativa de IA en Meta busca hacer que la tecnología avanzada de segmentación de imágenes sea más accesible para desarrolladores e investigadores.

AI at Meta computer vision AI tools Segment Anything Model

Introducing the Segment Anything Playground | AI at Meta

ARTICLEAI at Meta (YouTube)·20/11/2025

SAM 3D: Behind the two-model design | AI at Meta

Este artículo explora el diseño de dos modelos detrás de SAM 3D, una iniciativa de inteligencia artificial de Meta. Detalla la arquitectura y la lógica de ingeniería detrás de este sistema de IA.

AI models SAM 3D Model Architecture Meta AI

SAM 3D: Behind the two-model design | AI at Meta

RESEARCH↑ trendingReddit r/MachineLearning·10/4/2026

Looking to join a team working on AI/CV research (aiming to publish) [R]

Um assistente de pesquisa busca uma equipe para realizar trabalhos mais sérios em IA/ML, focando em visão computacional. O objetivo é aprofundar conhecimentos e publicar artigos. Ele convida equipes que procuram um colega a entrar em contato.

research computer vision AI Collaboration

ARTICLEDEV.to AI·24/4/2026

Flipping Product Photography: How to Seamlessly Change Backgrounds with AI

El contenido aborda el desafío de crear fotografías de productos consistentes para el comercio electrónico, resaltando el costo y la lentitud de los métodos tradicionales. Propone el uso de una API de generación de imágenes con IA para reemplazar fondos sin problemas, acelerando significativamente el flujo de trabajo.

workflow automation product photography computer vision image generation

ARTICLEDEV.to AI·2/5/2026

Advances in Multimodal AI: Researchers Develop New Framework for Fusion of Vision and Language

La IA multimodal, que integra múltiples fuentes de datos como visión y lenguaje, está ganando terreno debido a la creciente digitalización y a sus diversas aplicaciones en varios sectores. A pesar de su promesa, un desafío clave sigue siendo la fusión efectiva de tipos de datos dispares con diferentes requisitos de procesamiento.

multimodal AI computer vision Natural Language Processing

ARTICLEDEV.to AI·10/4/2026

Masked Face Recognition for Secure Authentication

Este artigo explora o reconhecimento facial de indivíduos mascarados como uma solução avançada para sistemas de autenticação seguros. Ele aborda os desafios e as inovações tecnológicas no uso da inteligência artificial para melhorar a segurança e a precisão em cenários de uso de máscaras.

biometrics security Face Recognition computer vision

ARTICLEDEV.to AI·15/4/2026

Computer Vision Trends 2026: Beyond Object Detection

Este contenido analiza las tendencias de Visión por Computadora para 2026, yendo más allá de la detección de objetos. Detalla el crecimiento de la industria, estadísticas clave como el tamaño del mercado y la adopción empresarial, y el stack tecnológico que incluye herramientas y plataformas en la nube.

2026 trends computer vision AI

ARTICLEDEV.to AI·21/4/2026

Common Limitations of Image Processing Metrics: A Picture Story

Este contenido analiza las limitaciones comunes de las métricas de procesamiento de imágenes, utilizando ejemplos visuales para ilustrar cómo los métodos de evaluación tradicionales pueden no alinearse siempre con la percepción humana o reflejar con precisión el rendimiento del algoritmo. Destaca los desafíos en la evaluación objetiva de la calidad y eficacia del procesamiento de imágenes.

evaluation Image processing AI limitations Metrics

ARTICLEDEV.to AI·10/4/2026

From Fins to Files: AI-Powered Photo Proof for Fishermen

Este conteúdo aborda como a inteligência artificial pode resolver disputas de documentação para pescadores comerciais, utilizando fotos de alta qualidade como prova central. Aplicativos de logbook com IA e visão computacional podem identificar espécies, estimar tamanhos e automatizar registros de captura, aumentando a eficiência e a conformidade.

fisheries Digital Logbook computer vision Species Identification

ARTICLEDEV.to AI·1/5/2026

My Journey with AI & Fashion MNIST

Este artículo narra el viaje personal del autor en la clasificación de imágenes de ropa utilizando una Red Neuronal Secuencial y el conjunto de datos Fashion MNIST, enfrentando el desafío de diferenciar zapatillas de bolsos. Después de que el modelo fallara con fotos reales, el autor detalló las estrategias de superación, incluyendo el refinamiento del preprocesamiento y la normalización de la entrada, además de reconocer la necesidad de CNNs para datos del mundo real.

neural networks image classification machine learning computer vision

ARTICLEHugging Face (YouTube)·13/4/2026

Are We Overusing Giant Vision Models?

Este artículo cuestiona la práctica actual de utilizar modelos de visión de IA excesivamente grandes. Explora si la complejidad y los recursos necesarios para estos modelos siempre se justifican.

AI models efficiency computer vision model scaling