IMPLEMENTAR UN SISTEMA DE RECUPERACIÓN DE DATOS DE FORMULARIOS ESCANEADOS APLICANDO OCR - Perfil
Código:
1928
Autor(es):
Bustamante Cruz Henry
Area(s):
Inteligencia Artificial
SubArea(s):
Redes Neuronales
Gestión de Inicio:
2/2014
Modalidad:
Proyecto de Grado
Carrera:
Licenciatura en Ingenieria de Sistemas
Tutor:
Lic. Valentin Laime Zapata
Objetivo General:
Implementar un sistema de recuperción de informacion de formularios digitales
Objetivos específicos:
-
Pre-procesar el formulario digital para reducir los defectos incluidos en el mismo
-
Segmentar partes del documento digital para identificar el texto a reconocer
-
Extraer caracteristicas de la imagen del caracter o elemento a reconocer
-
Reconocer datos de campos de las imágenes anteriormente procesadas
-
Generar un archivo con la información reconocida
Descripción :
Un OCR (Reconocimiento Óptico de Caracteres) es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen, símbolos o caracteres que pertenecen a un determinado alfabeto, para luego ser almacenados en forma de datos, Para dicho fin un OCR engloba un conjunto de técnicas y fases a seguir para lograr su cometido, que son Adecuación de la imagen, selección de la zona de interés, representación digital de la imagen y distinción del caracter contenido en la imagen.