Creación de una base de datos para la evaluación del desempeño de algoritmos de reconocimiento de fórmulas matemáticas extraídas desde un archivo en formato PDF


Abstract:

En la actualidad el paso de información científica en su mayoría se da mediante artículos que en gran parte de los casos se encuentran en formato PDF, lo cual ha hecho que crezca la popularidad de dicho formato y que hace necesario manipular este tipo de documentos, tareas como extraer texto, tablas, figuras y fórmulas son ineludibles para ser analizadas y procesadas. Una de las tareas más importantes en la detección y reconocimiento de fórmulas matemáticas es identificar correctamente su ubicación dentro de un documento, uno de los principales problemas en todos estos trabajos dedicados a la detección de fórmulas es validar su desempeño ya que los programas y las bases de datos con las que se puede realizar la validación no son válidas o no son de uso libre. En este proyecto se busca mediante el procesamiento de archivos pdf y procesamiento digital de imágenes crear una base de datos que contenga posición y caracteres de fórmulas matemáticas extraídas de un archivo en formato PDF. Para eso se usará como base el trabajo propuesto por (Xiaoyan Lin L. G., 2012) para que nuevos algoritmos y los ya existentes de reconocimiento posición y caracteres de fórmulas matemáticas puedan ser evaluados o probados para tener un criterio equitativo de rendimiento.

Año de publicación:

2018

Keywords:

  • Algoritmos
  • Análisis matemático
  • ARCHIVO PDF
  • PROGRAMACIÓN (MATEMÁTICAS)

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Base de datos
  • Ciencias de la computación
  • Base de datos

Áreas temáticas:

  • Ciencias de la computación
  • Programación informática, programas, datos, seguridad
  • Funcionamiento de bibliotecas y archivos