Diferencia entre revisiones de «Reconocimiento óptico de caracteres»

m (Texto reemplazado: «<div align="justify">» por «»)
(Agrega ejemplo de aplicaciones OCR)
 
Línea 77: Línea 77:
  
 
Es cierto que también pueden reconocer textos escritos manualmente, pero en este caso siempre a condición de que estén escritos claramente, a ser posible con letra de molde, y que esta se asemeje lo más posible a un tipo de letra existente.
 
Es cierto que también pueden reconocer textos escritos manualmente, pero en este caso siempre a condición de que estén escritos claramente, a ser posible con letra de molde, y que esta se asemeje lo más posible a un tipo de letra existente.
 +
 +
== Véase también ==
 +
 +
* [[FotoRecarga]]: aplicación cubana de código abierto para la plataforma [[Android]] que facilita la recarga del saldo de [[Cubacel]] mediante técnicas de OCR.
 +
* [[gimagereader]], interfaz gráfica GTK+ para tesseract-ocr.
 +
* [[Tesseract]], librería OCR para el desarrollo de aplicaciones.
  
 
== Fuente ==
 
== Fuente ==

última versión al 15:17 14 oct 2019

Reconocimiento óptico de caracteres
Información sobre la plantilla
I2OCR.jpg
Software de reconocimiento de texto en imagenes.

Reconocimiento óptico de caracteres. Conocido por sus siglas en inglés como OCR (Optical Character Recognition). Es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edición de texto.

Proceso

El proceso de OCR se inicia a partir del análisis de esta imagen que dará como resultado la conversión de los conjuntos de puntos en caracteres manipulables como los archivos producidos en cualquier tratamiento de textos. Una vez acabada esta parte, se inicia una fase de chequeo de los resultados para terminar exportando los resultados a otro tipo de aplicación (tratamientos de texto, programas de edición, hojas de cálculo, entre otras aplicaciones).

Mientras se ejecutan las acciones del reconocimiento de caracteres, los programas analizan las imágenes de los párrafos escritos para producir el correspondiente texto editable. Después de acabar el proceso, se puede exportar el texto reconocido, mediante los pertinentes formatos, a toda la amplia variedad de aplicaciones, que trabajan con el producto resultante.

Características

  • Son caracteres impresos cuya información es leída automáticamente por un haz de luz y decodificados por algoritmos matemáticos a una forma digital, analógica o ASCII.
  • La lectura es por contacto a distancia, el haz es fijo o móvil y visible o no (infrarrojo). Estos sistemas están siendo desplazados por el Código de Barras, para su uso comercial masivo.
  • El código de barras no es un sistema automático de identificación ya que tanto la marcación como la lectura de cada producto es manual y el sistema OCR se refiere solamente a los sistemas que leen automáticamente la información.

Objetivos

Los sistemas de reconocimientos ópticos de caracteres, así como los de reconocimientos de texto en general, tienen como objetivo automatizar la introducción de caracteres al sistema, evitando la entrada por el teclado, implicando un importante ahorro de recursos para las empresas y un incremento en la productividad en el mismo tiempo que se preserva o mejora la calidad de los servicios ofrecidos al cliente.

Variantes de sistemas OCR

Existen sistemas OCR muy diversos según los tipos de problemas que abordan y las funcionalidades que ofrecen. Existe una terminología de empleo extendido en la industria para referirse a cada una de las variantes específicas de sistemas OCR.

  • ICR (Intelligent Character Recognition): se utiliza para designar el reconocimientos de caracteres manuscritos.
  • OCV (Optical Character Verification): hace referencia a la verificación de contenidos previamente conocidos.
  • OMR (Optical Mark Recognition): designa una funcionalidad de reconocimientos de marca.

Problemática de los OCR

El problema del reconocimiento óptico de caracteres ha estado abordado de manera intensa por disciplinas científicas, como el "Reconocimiento de formas" y "Visión artificial". La características de este problema y las diversas vertientes que presenta, hacen que sea un proceso en continua investigación. Desde el reconocimiento de caracteres impresos, de uno o multiples tipos de letras (considerado en la práctica como un problema superado), como la escritura continua, restringida o no (de gran dificultad intrínseca), pasando por el reconocimiento de caracteres manuscriotos aislados o la disposición fija o flotante del texto a reconocer, son unos de los problemas mas frecuentes en los sistemas OCR.

Desventajas de sistemas anteriores

El sistema usado hasta no hace mucho consistía en que el OCR aislaba la imagen correspondiente a un carácter y la comparaba con una base de caracteres para determinar su correspondiente código ASCII o bien Unicode. Una vez reconocido lo transformaba y lo trasladaba al documento OCR resultante. Este sistema tenía el inconveniente de que trabajaba con un número limitado de fuentes, por lo que el resultado obtenido no siempre era el deseado.

Ventajas de sistemas actuales

Los programas actuales de OCR están basados en el análisis de características de los caracteres en vez de en la coincidencia de las matrices de estos, lo que permite una mayor velocidad en el proceso y el no tener que depender de una limitada base de fuentes.

Hay en el mercado bastantes programas de OCR, entre los que cabe destacar los conocidos OmniPage, Abbyy Fine Reader o READiris. Versiones reducidas de estos programas suelen contarse entre el software incluido en los escáneres.

El OmniPage Professional por su amplia variedad de opciones y su buena presentación y funcionamiento.

Estos programas son de especial utilidad cuando necesitamos hacer referencia a textos en un escrito (copiar literalmente un texto dentro de otro), como puede ser el caso de redacción de informes o referencias bibliográficas.

También pueden ser utilizados en el mundo de la música, ya que la mayoría de ellos tienen también capacidad de leer partituras musicales.

Actualmente estos programas son capaces de reconocer no solo el texto en sí, sino también el estilo y formato de este, aunque dentro de unas limitaciones, haciendo necesario que posteriormente editemos el texto resultante y revisemos estos dos parámetros.

Requerimientos para un buen funcionamiento

Para su correcto funcionamiento es necesario que la imagen de donde provenga dicho texto esté en las mejores condiciones posibles para que pueda reconocer correctamente los caracteres. Hay que tener en cuenta que factores tales como un texto borroso (aunque sea solo ligeramente), papel manchado o demasiado fino, arrugas o arañazos en el documento, falta de una parte de una letra, cualquier tipo de transparencia en el papel, entre otros aspectos, van a dificultar el correcto reconocimiento de este texto.

El promedio de efectividad de los programas OCR, en perfectas condiciones, ronda el 90%, disminuyendo de forma ostensible al disminuir la calidad del original. A esto hay que añadir una correcta configuración del escáner tanto en su resolución como en su brillo y en la limpieza de la lente y cristal. Uno de los requisitos básicos para que un programa OCR funcione correctamente es que necesita una imagen de gran calidad.

Es cierto que también pueden reconocer textos escritos manualmente, pero en este caso siempre a condición de que estén escritos claramente, a ser posible con letra de molde, y que esta se asemeje lo más posible a un tipo de letra existente.

Véase también

  • FotoRecarga: aplicación cubana de código abierto para la plataforma Android que facilita la recarga del saldo de Cubacel mediante técnicas de OCR.
  • gimagereader, interfaz gráfica GTK+ para tesseract-ocr.
  • Tesseract, librería OCR para el desarrollo de aplicaciones.

Fuente