Reconocimiento óptico de caracteres (OCR)

Como hemos mencionado ya, el reconocimiento óptico de caracteres ha sido uno de los resultados que han pasado directamente del campo de la investigación en inteligencia artificial a su empleo masivo en diversas ramas de la actividad económica de nuestra sociedad. A este respecto, encontramos, por un lado, los códigos específicos para su reconocimiento por parte de los ordenadores y que permiten la lectura e introducción automática de los datos.

Por ellos representados en las instalaciones de procesamiento y, por el otro, los códigos de barras cuya aplicación se extiende cada día más a todos los ámbitos de las actividades humanas, desde las comerciales (donde están ya muy extendidas en los productos de consumo, de alimentos a publicaciones periódicas) hasta las deportivas (p. ej., lectura de dorsales de atletas, ect).

Los códigos de reconocimiento óptico de caracteres más conocidos son las escrituras normalizadas de los tipos A y B que corresponden a los OCR-A y OCR—B (CR = Optical Carácter Recognition, reconocimiento óptico de caracteres). El primero de dichos códigos fue desarrollado en el marco de la organización internacional de estandarización (ISO) y ha sido adoptado, entre otros, por el Instituto Alemán de Normalización DIN. El segundo código, OCR-B, se desarrollo en el marco de la unión europea de fabricantes de ordenadores (ECMA) y tiene el rango de recomendación para el ISO, si bien presenta ciertas dificultades de lectura cuando la impresión no es excesivamente buena.

Estos códigos, empleados internacionalmente, se aplican, por ejemplo, a la indicación de ciertas informaciones (números de cuenta, códigos bancarios, etc.) en los documentos bancarios tales como cheques y similares y a todos aquellos procesos en los que la información contenida de forma impresa no puede ser sustituida por otra manera de representación.

Si bien estos códigos han gozado de gran extensión durante un tiempo, la necesidad de emplear un sólo tipo de caracteres ha hecho redoblar los esfuerzos por construir sistemas físicos (sensores, lectores, etc.) y lógicos que permitan el reconocimiento de cualquier tipo de carácter impreso.

De esta forma, se ha logrado automatizar también la introducción del contenido de documentos a través de dispositivos capaces de reconocer cualquier letra, codificarla e introducirla automáticamente como si entrase a través del teclado. Esto facilita mucho, por ejemplo, el archivo masivo de información escrita.

Por otra parte, los códigos de barras, que constituyen otro tipo de codificación encaminada a la lectura y reconocimiento automático de caracteres informaciones, nacieron en 1973 con la adopción, por parte de los EE.UU., del código Universal.

Producto Code (UPC) que permitía, mediante el empleo de tan sólo 12 dígitos, asegurar un proceso de identificación claro y racional de la totalidad de los productos manufacturados. Sin embargo, a pesar de ser el primero el UPC, no ha podido superar, en cuanto a su extensión, al código europeo (EAN) creado en el año 1977. Este código está formado por 13 dígitos (dado que, por un lado, se pretendió que fuese compatible con el código UPC y, por el otro, se deseaba que lo englobase).

Los dígitos que forman el código europeo (EAN) tienen significados distintos según sus posiciones. Así, los dos primeros dígitos corresponden al número que la organización EAN asigna al país productor del artículo. Los diez caracteres que le siguen corresponden a la identificación del artículo en el país de origen. En algunos países, por ejemplo, los cinco primeros dígitos del grupo de diez identifican al fabricante, mientras que los cinco restantes corresponden al número con el cual el propio fabricante identifica el producto. Finalmente, el último dígito es un dígito de control que sirve para asegurar que la lectura de la información precedente ha sido correcta. Este dígito se obtiene mediante la aplicación de una determinada regla matemática.

En su conjunto, el código está estructurado de tal modo que puede ser leído mediante lectores ópticos automáticos y comprendidos directamente por el ordenador que recibe dicha información. Para ello, se ha elegido la representación de sus diversos dígitos mediante rayas verticales de diversos grosores (barras) alternadas con espacios intermedios en blanco.

Este código se aplica a los productos de consumo y, ya también, a la identificación de los lotes en los bancos de sangre, a la identificación de los libros en las bibliotecas, etc. Presenta una serie de ventajas tanto para los fabricantes de los productos como para sus consumidores finales. En cuanto a los últimos, este sistema posibilita que el cliente reciba un tiquet en el que se especifiquen detalladamente el producto y su precio; además, acelera el proceso de cobro y asegura mayor fiabilidad en los precios.

En cuanto al comerciante y al distribuidor, pueden disponer de información pormenorizada acerca de los mercados a los que sirven, de los stocks de que disponen, etc. El empleo de estos sistemas implica la introducción de los llamados lectores ópticos. Estos dispositivos pueden ser manuales (lápiz o pistola óptica) y de barrido (escáner), están formados por emisores de rayos láser de baja potencia en los que el rayo focalizado reconoce los signos cuando éstos pasan por una ventana de la que dispone el lector. La luz reflejada por los espacios blancos del código se transforma en señales eléctricas (es decir se digitaliza) y entra en el ordenador que contiene toda la información (precio, etc.) correspondiente al producto.

Finalmente, el ordenador se encarga de listarlos productos y sus precios, de dar la suma final de éstos y, en su caso, de indicar el cambio o aceptar el pago mediante tarjeta de crédito.