Documentos de Mafla A. | REDI

Regresar

Mostrando 4 resultados de: 4

Filtros aplicados

Palabras Claves: "Scene text"

Subtipo de publicación

Conference Object(3)

Publisher

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)(2)

Pattern Recognition Letters(1)

Proceedings of the International Conference on Document Analysis and Recognition, ICDAR(1)

Área temáticas

Métodos informáticos especiales(3)

Funcionamiento de bibliotecas y archivos(2)

Biblioteconomía y Documentación informatica(1)

Imprenta y actividades conexas(1)

Área de conocimiento

Ciencias de la computación(4)

Visión por computadora(3)

Inteligencia artificial(1)

Objetivos de Desarrollo Sostenible

ODS 17: Alianzas para lograr los objetivos(4)

ODS 4: Educación de calidad(4)

ODS 9: Industria, innovación e infraestructura(4)

Año de Publicación

Origen

Palabras Claves

Visual question answering(3)

ICDAR 2019 competition on scene text visual question answering

Conference Object

Abstract: This paper presents final results of ICDAR 2019 Scene Text Visual Question Answering competition (ST

Palabras claves:

Scene text, Scene understanding, Vision and language, Visual question answering

Furkan Biten A., Jawahar C.V., Karatzas D., Lluís Álvarez Gómez, Mafla A., Mathew M., Rusiñol M., Tito R., Valveny E.

MUST-VQA: MUltilingual Scene-Text VQA

Conference Object

Abstract: In this paper, we present a framework for Multilingual Scene Text Visual Question Answering that dea

Palabras claves:

Multilingual models, Power of language models, Scene text, Translation robustness, Visual question answering, Zero-shot transfer

Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A., Vivoli E.

Multimodal grid features and cell pointers for scene text visual question answering

Abstract: This paper presents a new model for the task of scene text visual question answering. In this task q

Palabras claves:

41A05, 41A10, 65D05, 65D17, deep learning, MSC, Multi-modal learning, Scene text, Visual question answering

Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A., Rusiñol M., Tito R., Valveny E.

Single shot scene text retrieval

Conference Object

Abstract: Textual information found in scene images provides high level semantic information about the image a

Palabras claves:

convolutional neural networks, Image retrieval, PHOC, Region proposals networks, Scene text, Word spotting

Karatzas D., Lluís Álvarez Gómez, Mafla A., Rusiñol M.