Documentos de Karatzas D. | REDI

Regresar

Mostrando 8 resultados de: 8

Filtros aplicados

Publisher: "Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)"

Subtipo de publicación

Conference Object(8)

Área temáticas

Métodos informáticos especiales(5)

Comunicaciones(1)

Funcionamiento de bibliotecas y archivos(1)

Instrumentos de precisión y otros dispositivos(1)

Interacción social(1)

Área de conocimiento

Ciencias de la computación(6)

Visión por computadora(4)

Análisis de datos(2)

Aprendizaje automático(1)

Año de Publicación

Origen

Palabras Claves

Self-supervised learning(2)

Webly supervised learning(2)

City tourism analysis(1)

Image retrieval(1)

Dynamic lexicon generation for natural scene images

Conference Object

Abstract: Many scene text understanding methods approach the endto-end recognition problem from a word-spottin

Palabras claves:

cnn, Lexicon generation, Photo OCR, Scene text, Scene understanding, Topic modeling

Karatzas D., Lluís Álvarez Gómez, Patel Y., Rusiñol M.

OCR-IDL: OCR Annotations for Industry Document Library Dataset

Conference Object

Abstract: Pretraining has proven successful in Document Intelligence tasks where deluge of documents are used

Palabras claves:

Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Tito R., Valveny E.

MUST-VQA: MUltilingual Scene-Text VQA

Conference Object

Abstract: In this paper, we present a framework for Multilingual Scene Text Visual Question Answering that dea

Palabras claves:

Multilingual models, Power of language models, Scene text, Translation robustness, Visual question answering, Zero-shot transfer

Furkan Biten A., Karatzas D., Lluís Álvarez Gómez, Mafla A., Vivoli E.

Learning from #barcelona instagram data what locals and tourists post about its neighbourhoods

Conference Object

Abstract: Massive tourism is becoming a big problem for some cities, such as Barcelona, due to its concentrati

Palabras claves:

City tourism analysis, Self-supervised learning, Social media analysis, Webly supervised learning

Gibert J., Gómez R., Karatzas D., Lluís Álvarez Gómez

Learning to learn from web data through deep semantic embeddings

Conference Object

Abstract: In this paper we propose to learn a multimodal image and text embedding from Web and Social Media da

Palabras claves:

Multimodal embeddings, Multimodal retrieval, Self-supervised learning, Text embeddings, Webly supervised learning

Gibert J., Gómez R., Karatzas D., Lluís Álvarez Gómez

Location Sensitive Image Retrieval and Tagging

Conference Object

Abstract: People from different parts of the globe describe objects and concepts in distinct manners. Visual a

Palabras claves:

Gibert J., Gómez R., Karatzas D., Lluís Álvarez Gómez

Scene text recognition: No country for old men?

Conference Object

Abstract: It is a generally accepted fact that Off-the-shelf OCR engines do not perform well in unconstrained

Palabras claves:

Karatzas D., Lluís Álvarez Gómez

Single shot scene text retrieval

Conference Object

Abstract: Textual information found in scene images provides high level semantic information about the image a

Palabras claves:

convolutional neural networks, Image retrieval, PHOC, Region proposals networks, Scene text, Word spotting

Karatzas D., Lluís Álvarez Gómez, Mafla A., Rusiñol M.