Documentos de Mafla A. | REDI

Regresar

Mostrando 10 resultados de: 10

Filtros aplicados

Área de conocimiento: "Ciencias de la computación"

Subtipo de publicación

Conference Object(8)

Publisher

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)(2)

Proceedings - 2021 IEEE Winter Conference on Applications of Computer Vision, WACV 2021(2)

Pattern Recognition(1)

Pattern Recognition Letters(1)

Proceedings - 2020 IEEE Winter Conference on Applications of Computer Vision, WACV 2020(1)

Área temáticas

Métodos informáticos especiales(7)

Biblioteconomía y Documentación informatica(3)

Funcionamiento de bibliotecas y archivos(3)

Imprenta y actividades conexas(2)

Programación informática, programas, datos, seguridad(2)

Área de conocimiento

Visión por computadora(7)

Aprendizaje automático(2)

Inteligencia artificial(1)

Objetivos de Desarrollo Sostenible

ODS 17: Alianzas para lograr los objetivos(9)

ODS 4: Educación de calidad(9)

ODS 9: Industria, innovación e infraestructura(9)

Año de Publicación

Origen

Palabras Claves

Visual question answering(3)

Image retrieval(2)

Word spotting(2)

ICDAR 2019 competition on scene text visual question answering

Conference Object

Abstract: This paper presents final results of ICDAR 2019 Scene Text Visual Question Answering competition (ST

Palabras claves:

Scene text, Scene understanding, Vision and language, Visual question answering

Furkan Biten A., Jawahar C.V., Karatzas D., Lluís Álvarez Gómez, Mafla A., Mathew M., Rusiñol M., Tito R., Valveny E.

Fine-grained image classification and retrieval by combining visual and locally pooled textual features

Conference Object

Abstract: Text contained in an image carries high-level semantics that can be exploited to achieve richer imag

Palabras claves:

Dey S., Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A.

Is An Image Worth Five Sentences? A New Look into Semantics for Image-Text Matching

Conference Object

Abstract: The task of image-text matching aims to map representations from different modalities into a common

Palabras claves:

Vision and Languages

Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A.

Real-time Lexicon-free Scene Text Retrieval

Abstract: In this work, we address the task of scene text retrieval: given a text query, the system returns al

Palabras claves:

convolutional neural networks, Image retrieval, PHOC, Region proposal networks, Scene text detection, Scene text recognition, Word spotting

Dey S., Karatzas D., Lluís Álvarez Gómez, Mafla A., Rusiñol M., Tito R., Valveny E.

MUST-VQA: MUltilingual Scene-Text VQA

Conference Object

Abstract: In this paper, we present a framework for Multilingual Scene Text Visual Question Answering that dea

Palabras claves:

Multilingual models, Power of language models, Scene text, Translation robustness, Visual question answering, Zero-shot transfer

Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A., Vivoli E.

Multi-modal reasoning graph for scene-text based fine-grained image classification and retrieval

Conference Object

Abstract: Scene text instances found in natural images carry explicit semantic information that can provide im

Palabras claves:

Dey S., Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A.

Multimodal grid features and cell pointers for scene text visual question answering

Abstract: This paper presents a new model for the task of scene text visual question answering. In this task q

Palabras claves:

41A05, 41A10, 65D05, 65D17, deep learning, MSC, Multi-modal learning, Scene text, Visual question answering

Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A., Rusiñol M., Tito R., Valveny E.

Scene text visual question answering

Conference Object

Abstract: Current visual question answering datasets do not consider the rich semantic information conveyed by

Palabras claves:

Furkan Biten A., Jawahar C.V., Karatzas D., Lluís Álvarez Gómez, Mafla A., Rusiñol M., Tito R., Valveny E.

Single shot scene text retrieval

Conference Object

Abstract: Textual information found in scene images provides high level semantic information about the image a

Palabras claves:

convolutional neural networks, Image retrieval, PHOC, Region proposals networks, Scene text, Word spotting

Karatzas D., Lluís Álvarez Gómez, Mafla A., Rusiñol M.

StacMR: Scene-text aware cross-modal retrieval

Conference Object

Abstract: Recent models for cross-modal retrieval have benefited from an increasingly rich understanding of vi

Palabras claves:

Karatzas D., Larlus D., Lluís Álvarez Gómez, Mafla A., Rezende R.S.