Reconocimiento óptico de caracteres

El OCR (Optical character recognition) es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edición de texto.

Ventajas

Cuando tenemos una imagen (ya sea una fotografía o un documento que hayamos escaneado), el texto que contiene forma parte de esa imagen, al igual que cualquier elemento de la misma (un dibujo o un esquema, por ejemplo). Pues bien, si necesitamos extraer ese texto para poder editarlo, necesitamos un programa de OCR que reconozca dicho texto y lo transforme en una cadena de caracteres (ya sea ASCII o Unicode) y posteriormente copiar esta cadena a un programa de edición para ya poder trabajar con ella, con el consiguiente ahorro de tiempo al no tener que teclear este texto.

Desventajas de sistemas anteriores

El sistema usado hasta no hace mucho consistía en que el OCR aislaba la imagen correspondiente a un carácter y la comparaba con una base de caracteres para determinar su correspondiente código ASCII o bien Unicode. Una vez reconocido lo transformaba y lo trasladaba al documento OCR resultante. Este sistema tenía el inconveniente de que trabajaba con un número limitado de fuentes, por lo que el resultado obtenido no siempre era el deseado. Además, en textos muy largos y con inclusión de frases en cursiva, por ejemplo, el proceso era bastante lento.

Ventajas de sistemas actuales

Los programas actuales de OCR están basados en el análisis de características de los caracteres en vez de en la coincidencia de las matrices de estos, lo que permite una mayor velocidad en el proceso y el no tener que depender de una limitada base de fuentes. Hay en el mercado bastantes programas de OCR, entre los que cabe destacar los conocidos OmniPage, Abbyy Fine Reader o READiris. Versiones reducidas de estos programas suelen contarse entre el software incluido en los escáneres.

El OmniPage Professional por su amplia variedad de opciones y su buena presentación y funcionamiento. Estos programas son de especial utilidad cuando necesitamos hacer referencia a textos en un escrito (copiar literalmente un texto dentro de otro), como puede ser el caso de redacción de informes o referencias bibliográficas. También pueden ser utilizados en el mundo de la música, ya que la mayoría de ellos tienen también capacidad de leer partituras musicales. Actualmente estos programas son capaces de reconocer no solo el texto en sí, sino también el estilo y formato de este, aunque dentro de unas limitaciones, haciendo necesario que posteriormente editemos el texto resultante y revisemos estos dos parámetros.

Requerimientos para un buen funcionamiento

Para su correcto funcionamiento es necesario que la imagen de donde provenga dicho texto esté en las mejores condiciones posibles para que pueda reconocer correctamente los caracteres. Hay que tener en cuenta que factores tales como un texto borroso (aunque sea solo ligeramente), papel manchado o demasiado fino, arrugas o arañazos en el documento, falta de una parte de una letra, cualquier tipo de transparencia en el papel, etc. van a dificultar el correcto reconocimiento de este texto. El promedio de efectividad de los programas OCR, en perfectas condiciones, ronda el 90%, disminuyendo de forma ostensible al disminuir la calidad del original. A esto hay que añadir una correcta configuración del escáner tanto en su resolución como en su brillo y en la limpieza de la lente y cristal. Uno de los requisitos básicos para que un programa OCR funcione correctamente es que necesita una imagen de gran calidad. Es cierto que también pueden reconocer textos escritos manualmente, pero en este caso siempre a condición de que estén escritos claramente, a ser posible con letra de molde, y que esta se asemeje lo más posible a un tipo de letra existente.

Fuente

http://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres

http://www.athento.com/ocr/